[NLP 입문] 자연어 처리(NLP)란 무엇인가? ⭐

>

자연어(natural language) 자연어(natural language)란 자연계에 존재할 수 있는 모든 언어, 더 쉽게 말해 우리가 일상생활에서 사용하는 언어를 의미한다.컴퓨터는 인간과 달리 예외 처리에 매우 어려움을 겪고 있다. 컴퓨터 내에서 다루는 언어, 예를 들어 프로그래밍 언어는 모든 예외가 사전에 정의되어 있어 규칙에 맞게 수행할 수 있지만 자연어는 그렇지 않다.자연어 처리(natural language processing) 자연어 처리란 위와 같은 자연어를 컴퓨터가 처리할 수 있도록 하는 분야를 말한다.인간의 언어를 컴퓨터에 이해시킨다는 것은 인간이 무의식적으로 처리하고 있는 수많은 예외처리를 컴퓨터에 이해시키는 것으로, 이는 인공지능 안에서 매우 중요한 연구 분야로 주목받고 있다. 자연어 처리 중에서도 아래와 같은 다른 분야가 존재한다.-형태소 분석-주제의미 분석-군집화 및 분류-기계 번역-관심사 예측 및 추천-기타 등등, 필자는 지난해(2019) 수행한 프로젝트 덕분에 싫어도 Topic modeling 및 Recommendation에 관한 공부를 하게 되었고, 그 과정에서 배운 것을 톰톰히 포스팅하려 하고 있다.환경 구축 관련 포스팅은 모두 Python에서 이루어지며 기본적으로 필자가 공부하고 참고한 아래 링크대로 차례를 따라간다. 그 후 실제로 필자가 프로젝트를 수행하면서 경험한 점을 중심으로 흐름이 이어질 것 같다. Python(아나콘다 및 colab 권장이 아니다) 아나콘다 및 colab 등을 사용해도 무방하지만 필자는 그대로 포스팅할 때마다 필요한 라이브러리를 그때그때 설치하고 순수한 W Indows 10 로컬 환경에서 진행한다.References 딥러닝을 이용한 자연어 처리 입문