Skip to content

mysoulmq/Spider_Learning

Repository files navigation

主要是学习爬虫期间做的一些东西,有待完善

1 . CookiePool_Weibo

  • 模拟登录微博获取Cookies
  • 通过Redis构建一个Cookies池
  • 将获取的Cookies存入Cookies池中

2 . ProxyPool_Wechat

  • 从各大代理网站抓取免费代理,每隔一段时间获取一次,存入到Redis的有序集合中,构建一个代理池
  • 测试一下代理的可用性,给其设置一下score。
  • 本地开启一个Flask接口,通过一个HTTP接口获取可用代理
  • 抓取搜狗微信站点的微信文章,对接代理池

3 . Complie_Priniple

  • 获取中国MOOC上编译原理课程中每个视频的URL
  • 通过异步方式下载视频

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published