scrapy_zhihu

crawl zhihu using scrapy

这是在不模拟登录的情况对知乎的抓取，因此有些信息是取不到的。
想抓取自己想要的内容之后，可以进行一些操作，
比如按时间排序，按评论数排序，按内容长短排序等

@todo:

sql migrate文件
user parse
falsk web app
配置抽离
网页模板抽离
celery发送任务
定时任务设计
web开发使用api获取数据，前后端分离，前端考虑使用vue

问题记录

自己本身在Window下开发的

celery启动不了，出现， ImportError: cannot import name _uuid_generate_random, 查看Kombu import error on Python 2.7.11
启动celery需要指定队列，若是backend使用redis,则需要启动，到对应redis目录下，先启动服务：redis-server.exe redis.conf

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
config		config
cralwer		cralwer
dispatacher		dispatacher
models		models
test		test
web		web
.gitignore		.gitignore
README.md		README.md
manager.py		manager.py
requirements.txt		requirements.txt
schedule.py		schedule.py
start_app.py		start_app.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

config

config

cralwer

cralwer

dispatacher

dispatacher

models

models

test

test

web

web

.gitignore

.gitignore

README.md

README.md

manager.py

manager.py

requirements.txt

requirements.txt

schedule.py

schedule.py

start_app.py

start_app.py

Repository files navigation

scrapy_zhihu

@todo:

问题记录

About

Releases

Packages

Languages

night1008/scrapy_zhihu

Folders and files

Latest commit

History

Repository files navigation

scrapy_zhihu

@todo:

问题记录

About

Resources

Stars

Watchers

Forks

Languages