◎ 텍스트 마이닝 심화 ○ 머신러닝 기법 : LDA(토픽 모델링 기법), SVM(문서 분류 기법) 등 ○ 딥러닝 기법 : RNN, LSTM, Transformer, BERT 등 워드 임베딩(Word Embedding)은 딥러닝 기법의 입력값으로 사용 ○ 워드 임베딩 단어를 컴퓨터가 이해할 수 있는 벡터로 표현하는 방법 Sparse Representation (BOW, TF-IDF) Dense Representation (word2vec, Glove 등) ※ Sparse Representation의 문제점 문서 데이터에 존재하는 모든 유니크한 단어 수가 벡터의 차원이 되어 고차원 공간이 됨 단어의 문맥 정보가 사라짐 (e.g. 문장 내 순서(word order), 문장 내 동시 등장(co-occurrenc..