Skip to content

Zing22/zhihutu

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ZhiHuTu

爬取一个知乎答主所有回答里的图片,并保存到本地MongoDB中。

Dependencies

  1. Python 3.x, with requests==2.18.2, pymongo==3.4.0
  2. MongoDB v3.4.6

Web Dependencies(Optional)

  1. Python-Flask 0.12.2

Usage

修改zhihutu.py中的COOKIES_STR变量为你本地打开知乎页面时,Requests Headers中的Cookie字段。

在命令行中:

python zhihutu.py -g <url_token>

抓取用户<url_token>的所有回答下的图片链接并输出。会在本地MongoDB下创建zhihutu/author。

点击知乎用户个人主页,在URL中可以找到<url_token>

https://www.zhihu.com/people/<url_token>/answers

其他用法:

python zhihutu.py -h

注意:只有50赞以上的回答中的照片才会被保存,这个设置可以在database.py中找到。

Web Usage

确保安装flask后,在命令行输入:

python web.py

用浏览器打开127.0.0.1:7070查看页面。

License

MIT LICENSE

About

爬取一个知乎答主所有回答里的图片,并保存到本地MongoDB中

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published