Skip to content

基于python的影评数据爬取和分析研究(此项目用于毕业设计)

Notifications You must be signed in to change notification settings

OoGod/crawlAndAnalysisOfFilmReviewData

Repository files navigation

crwalAndAnalysisOfFilmReviewData

基于python的影评数据爬取和分析研究(此项目用于毕业设计)

由于复制外文pdf文件文本有许多空格,于是制作了del_spa.py用于去复制过去的文本空格

使用方式

# 不制定文件名默认去machine.txt的空格,并输出到output.txt中,这里举例去test.txt中的空格
python del_spa.py test.txt

翻译文件

# 翻译文本并输出到test1.txt中
python translate.py machine.txt

去空格并且翻译文本

# 去掉文本之间的换行符,并且翻译文件最后输出到test1.txt中
python run_tran.py machine.txt

代码改进

很久前的代码,可以了解String类的split(),lstrip()方法进行改进

About

基于python的影评数据爬取和分析研究(此项目用于毕业设计)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages