본문 바로가기

텍스트 분석

파이썬을 이용해서 단어 빈도 세기: 이 글의 주요 내용은 무엇일까? 긴 문서를 읽다 보면 한 번씩 '아 귀찮다'라는 생각이 듭니다. 누가 와서 간단히 요점만 말해주면 좋을 것 같습니다. 글의 주요 내용을 어떻게 하면 간단히 알아챌 수 있을까요? 이렇게 생각해 볼 수 있을 것 같습니다. 글쓴이는 말하고자 하는 내용을 강조하기 위해 특정 단어들을 더 많이 사용했을 것이다. 이제 남은 일은 단어들이 언급된 빈도를 세어보는 일입니다. 하지만 단어 빈도를 세는 일은 사람이 하기에는 적합한 일이 아닙니다. 컴퓨터가 하기에 적합한 일이죠. 파이썬에게 문서 내의 각 단어의 빈도를 세어달라고 하겠습니다. 이번 글에서는 2020년 대통령 신년사로 빈도 분석을 해보았습니다. 한나눔 형태소 분석기로 명사만을 추출했습니다. 상위 단어를 보면 것(할 것, 될 것, 갈 것 등), 수(할 수, 갈 .. 더보기
[파이썬] 윈도우에 KoNLPy 설치하기: JDK 설치부터 실행까지 KoNLPy를 설치하고 사용하는 과정에서 겪은 에러 사항을 정리합니다. 문제의 발단은 공식문서를 읽어보지 않고 설치 및 실행한 것이었습니다. 당당히 실행을 시켰는데 아래와 같은 에러가 출력되었습니다. 공식문서를 살펴보면 아래와 같은 안내 문구가 쓰여있습니다. 안내 사항을 차례대로 따라가 보겠습니다. 1. JDK 설치 - 안내에서 알려주는 JDK 설치 링크를 따라갑니다. 본인의 OS에 맞게 파일을 다운로드하고 설치합니다. - 설치 경로가 이후 과정에서 필요하니까 기억해둡니다. 2. JAVA_HOME 설정 - [제어판 > 시스템 및 보안 > 시스템 > 고급 시스템 설정 > 환경 변수] 클릭 - 환경 변수 창에서 시스템 변수(S)의 [새로 만들기]를 선택 - 변수 이름과 변수 값을 입력 3. JPype1 설치.. 더보기