Skip to content

chaoyifei/python

Repository files navigation

#python selenium为自动化测试框架,其余为python scrapy爬虫

影评分析: 主要做了三件事: 抓取网页数据 清理数据 用词云进行展示 python2.7 1、第一步要对网页进行访问,python中使用的是urllib2库 2、第二步,需要对得到的html代码进行解析,得到里面提取我们需要的数据,使用BeautifulSoup。 3、用jieba分词统计词频(numpy) 4、用云词显示wordcloud

https://pan.baidu.com/s/17JimPl3bA2ShVHPZK1z9ow

cacha为缓存爬虫

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages