오늘의 TIL

 

 

NLP 시리즈 시작

문서 데이터들을 이용한 머신러닝 프로젝트를 위해 NLP 관련 지식들을 정리하기 시작했습니다.

프로젝트는 4월까지 진행될 예정입니다.

프로젝트를 위한 웹 스크래퍼 제작

지금까지 만들어 본 봇은 단순히 하나의 사이트의 정보를 긁어오는 수준이었습니다.
하나의 모델을 학습시키기 위해서는 최대한 많은 정보를 모아 데이터를 구축해야 하는데 데이터를 많은 데이터를 잘 정제하고 저장하는 툴의 필요성을 느끼게 됐습니다.
따라서 기존 스크래퍼보다 개선된 스크래퍼를 제작 중에 있습니다.
관련 포스트는 기능별로 포스팅될 예정입니다.

태그:

카테고리:

업데이트:

댓글남기기