Skip to content

zouxixi1994/spider-lianjia

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 

Repository files navigation

链家二手房爬虫

2018年2月9日更新 (new_lianjia)

使用scrapy,爬取全部地区的二手房和租房的数据。
只写了逻辑部分

功能:爬取指定城市的二手房信息

用到的东西比较杂,主要是复习之前一个月爬虫的学习内容,没有开多进程,爬取一页信息后sleep3秒(其实1秒也可以),这样的速度不会被封IP。

一个有10000套二手房的城市需要半个小时爬取完, 需要爬哪个城市的二手房可以在config文件设置。

第一次用github,折腾了两个小时终于发上来了。。。。。。

spider.py主程序

request.py 包含requests请求函数和获取总页数的函数

config.py 各种配置

try.py 多余没用的文件

爬取信息:
image

About

链家二手房爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%