Skip to content

Latest commit

 

History

History
45 lines (28 loc) · 917 Bytes

Readme.md

File metadata and controls

45 lines (28 loc) · 917 Bytes

졸업프로젝트 POTY (Play Of The Youtube)

Find Highlight part with Youtube comments

Clustering with Python

python version : python 3.7

CommentCollector

chromedriver, lxml, beautifulSoap4 사용

data_processing.py

input으로 들어온 json 데이터 중 댓글과 관련된 데이터만 가져온다.

구현 방법

Regular Expression을 활용하여 댓글 데이터 중 시간과 관련된 데이터를 파싱 

flask

현재 AZURE 서버에서 배포
 

실행 방법

pip3 install flask
pip3 install flask-cors
pip3 install flask_restful
python app.py

구동 과정

data_procssing.py : youtube API에서 가져온 raw data 중 댓글 데이터만 추출
input_dummy.json --> output_dummy.json
comment_highlight.py : 댓글 중에 하이라이트들을 선택
output_dummy.json --> result.json