Skip to content

jerrylin07/Scraping_Comics_Information_from_Comixology

Repository files navigation

Scraping_Comics_Information_from_Comixology

以下不是使用说明,只是一些碎碎念 第一次在Github上面写Readme,也算是一种成长吧。开始这个项目也小半年了,不能说没有长进,但实在拿不出手,最近一次更新是从BeautifulSoup转移阵地到Lxml,的确快了不少,但 与此同时发现Excel编辑跟不上了,所以下一阶段是学会用Python搞数据分析,争取Python的事Python解决,Excel只是用来打开csv。 目前已经能完整爬取CMX的所有内容,但还是太保守了一点,一次几千本,看(http://felipegalvao.com.br/blog/2016/05/24/web-scraping-with-python-scraping-digital-comics-information-from-comixology/ )这个项目都是一次上万本(CMX的编号也就到8w多)。争取看懂人家的爬虫 然后下面就是往数据分析方面开火,加油 1024程序员节后一天 20/10/25

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages