최대 1 분 소요

본 포스팅은 고려대학교 강필성 교수님의 비정형데이터분석 강의를 바탕으로 학습한 내용입니다.



Text Representation

  • 문서에 있는 Text들을 수치화하는 것이 목적임
  • 아래와 같이 문서는 길이기 가변적일 때 (문장의 길이도 다르고, 문서의 양도 다르고..) 일련의 전처리(특수문자 제거, 대문자를 소문자로 바꾸는 등..)의 과정을 거친 후 고정된 크기의 수치로 나타내고자 하는 것



참고자료


댓글남기기