Xử lý ngôn ngữ tự nhiên
Vector Embeddings / Work Embeddings

Vector Embeddings / Work Embeddings

Như đã biết, các thuật toán học máy hầu như không có khả năng nhận diện và xử lý dữ liệu thuộc dạng văn bản thô, chúng yêu cầu đầu vào ở dạng số để thực hiện quy trinh suy luận của mình. Work Embedding là quá trình biểu diễn các từ dưới dạng số (vector số) dựa trên việc cố gắng nắm bắt các mối quan hệ về ngữ nghĩa và ngữ cảnh của dữ liệu đầu vào. Điều này có nghĩa, các vector sẽ có sự tương đồng về hướng & khoảng cách (trong không gian được xét) nếu chúng đại diện cho các từ có nghĩa tương tự.

Minh họa, các từ có nghĩa tương đồng sẽ có biểu diên dưới dạng vector gần nhau.

Bình luận & Cảm xúc