오늘의 TIL
웹 크롤링 및 키워드 분석
나무위키-나무뉴스의 텍스트로 크롤링을 진행해봤습니다.
konlpy를 이용해 키워드를 추출한 뒤 분석해보는 작업을 했습니다.
프로젝트의 결과는 최종적으로 pytagcloud를 이용해
키워드 관련 워드클라우드 이미지를 만드는 것 입니다.
가상환경에서 konlpy를 쓰는데 이슈가 있었습니다.
konlpy의 jvm을 수정 해줌으로써 이슈를 해결할 수 있었습니다.
jvm.py의 67번째 줄의 코드에서 convertStrings=True로 argument를 보내는 것이 문제였습니다.
convertStrings argument 부분은 default가 true로 설정되어 있기에 코드를 지워서 충돌을 해결할 수 있었습니다.
댓글남기기