Word2Vec #Fasttext #Doc2Vec #NLP1 [NLP #2] Word2Vec & Fasttext & Doc2Vec Embedding: Word2Vec (2013) 2. 주변 맥락으로 단어를 표현해 보자 주변 단어가 비슷한 단어들은 배열이 유사해 질 것. (즉, 유사 단어끼리 유사한 배열을 가질 수 있다.) 배열은 단어의 주변 맥락을 표현한다. 이를 더하고 뺌으로써 단어 사이의 관계를 파악할 수 있다. ★ 단점 동음이의어를 구분할 수 없다. 우리는 말을 보며 말을 나눴다 → 말을 이라는 단어의 배열에는 horse와 mouth의 맥락이 혼재된다. 전혀 관계 없더라도 주변 단어가 비슷하면 비슷하게 임베딩 된다. 오늘 __ 갔다 → '학교, 서울, 그곳에' 등 무관한 단어가 비슷하게 표현된다. 단어 단위로 학습하다 보니 문장 단위의 맥락을 이해하지 못한다. 어제 식당에서 친구를 만났다. 거기서 함께 밥을 먹었다. → 거기서.. 2024. 2. 5. 이전 1 다음