Skip to content

jajohe/taoguba_xueqiu_book

 
 

Repository files navigation

python抓取雪球 淘股吧文章

scheme

Last 更新虎嗅上 任正非马云马化腾演讲访谈等

add 简书地址   发布任正非华为讲话集合 心声社区 + 新浪博客整理

多看阅读效果

标题

directory  

内容

scheme

目录

scheme

雪球使用

XQHttp.py 文件需要配置你自己的Cookie 也就是header 中’Cookie': 值 xq_a_token 和bid

ReadList.txt 填写需要抓取的雪球大V 地址 例如:https://xueqiu.com/2733321298 抓取贴子,言论,API说明: _url = "http://xueqiu.com/v4/statuses/user\_timeline.json?user\_id={0}&page={1}&type=2" 2主贴 5 回复 ""为全部 可自行修改,位于xueqiu_worker.py

淘股吧

如果TGBHttp.py 中Cookie过期,需要更新, 淘股吧(只发布抓取帖子版,完整抓取用户所有日志,跟帖不在此发布

ReadList.txt配置 帖子地址 例如 龙飞虎 我相信这个帐号的未来会很灿烂! https://www.taoguba.com.cn/Article/175600/0 原贴地址/0 表示默认抓取完全部帖子,原贴地址/x 表示抓取到第x页 ,默认 0 默认配置 提取主贴 + 点亮 + 捧场 + 作者所有回复 如需帖子完整版,配置taoguba_article 解析

after all

看看人家巴菲特 其他知乎助手 抓微信(传送门文章)山石观市

程序fork自 EE-Book 知乎助手

原EE-Book介绍:

EE-Book

中文 | English

EE-Book 是一个命令行程序,它可以从网络上爬取内容制作成EPub格式电子书。

网页版 →_→ ee-book.org

目录


支持的网站

名称 主页 支持类型
知乎 www.zhihu.com 问题: zhihu.com/question/{question_id}
答案: zhihu.com/question/{question_id}/answer/{answer_id}
话题: zhihu.com/topic/{topic_id}
用户的全部回答: zhihu.com/people/{people_id} or zhihu.com/people/{people_id}/answers
收藏夹: zhihu.com/collection/{collection_id}
专栏: zhuanlan.zhihu.com/{zhuanlan_id}
简书 www.jianshu.com 用户的所有文章: jianshu.com/users/{people_id}/latest_articles
专题: jianshu.com/collection/{collection_id}
文集: jianshu.com/notebooks/{notebooks_id}/latest or jianshu.com/notebooks/{notebooks_id}/top
csdn博客 blog.csdn.net 用户的所有文章: blog.sina.com.cn/u/{people_id}
新浪博客 blog.sina.com.cn 用户的所有文章: blog.csdn.net/{people_id}
博客园 www.cnblogs.com 用户的所有文章: cnblogs.com/{people_id}/
易百教程 www.yiibai.com 某个教程的文章: yiibai.com/{tutorial_kind}
Talk Python To Me www.talkpython.fm 文稿: https://talkpython.fm/episodes/all/

用法

获得帮助信息:

$ python ee-book -h

举个例子:

$ python ee-book -u jianshu.com/users/b1dd2b2c87a8/latest_articles

稍等片刻, 你就可以得到电子书了:

directory

scheme

参与进来

...当然欢迎

搭建 EE-Book 的开发环境

$ pip install -r requirements.txt

安装 pyqt4

相关信息

感谢

License

MIT license.

About

巴菲特致股东信合集,抓取淘股吧,雪球 帖子言论,虎嗅上任正非马云马化腾讲话 合集制作epub电子书

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 97.7%
  • CSS 1.3%
  • HTML 1.0%