Scraping_Comics_Information_from_Comixology

以下不是使用说明，只是一些碎碎念第一次在Github上面写Readme，也算是一种成长吧。开始这个项目也小半年了，不能说没有长进，但实在拿不出手，最近一次更新是从BeautifulSoup转移阵地到Lxml，的确快了不少，但与此同时发现Excel编辑跟不上了，所以下一阶段是学会用Python搞数据分析，争取Python的事Python解决，Excel只是用来打开csv。目前已经能完整爬取CMX的所有内容，但还是太保守了一点，一次几千本，看（http://felipegalvao.com.br/blog/2016/05/24/web-scraping-with-python-scraping-digital-comics-information-from-comixology/ ）这个项目都是一次上万本（CMX的编号也就到8w多）。争取看懂人家的爬虫然后下面就是往数据分析方面开火，加油 1024程序员节后一天 20/10/25

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
ComixologyBestSellers.py		ComixologyBestSellers.py
ComixologyInfo 2.0.py		ComixologyInfo 2.0.py
ComixologyInfo.py		ComixologyInfo.py
ComixologyNewComics.py		ComixologyNewComics.py
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ComixologyBestSellers.py

ComixologyBestSellers.py

ComixologyInfo 2.0.py

ComixologyInfo 2.0.py

ComixologyInfo.py

ComixologyInfo.py

ComixologyNewComics.py

ComixologyNewComics.py

README.md

README.md

Repository files navigation

Scraping_Comics_Information_from_Comixology

About

Releases

Packages

Languages

jerrylin07/Scraping_Comics_Information_from_Comixology

Folders and files

Latest commit

History

Repository files navigation

Scraping_Comics_Information_from_Comixology

About

Resources

Stars

Watchers

Forks

Languages