[Text Representation] Count-based Methods
본 포스팅은 고려대학교 강필성 교수님의 비정형데이터분석 강의를 바탕으로 학습한 내용입니다.
Text Representation
- 문서에 있는 Text들을 수치화하는 것이 목적임
-
아래와 같이 문서는 길이기 가변적일 때 (문장의 길이도 다르고, 문서의 양도 다르고..) 일련의 전처리(특수문자 제거, 대문자를 소문자로 바꾸는 등..)의 과정을 거친 후 고정된 크기의 수치로 나타내고자 하는 것
댓글남기기