Skip to content

yipc/Yandere-crawler

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

56 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Yande.re图片爬虫

前言

手动刷图费时费力,至少我是这么想的。于是就有了这个项目及后续更新

本项目基于Win7, Python3.5.2Win10, Python3.6.7开发,在Ubuntu16.04, Python3.5.2运行成功,其他环境未考虑。

功能

  • 支持从指定的开始页码爬取到结束页码
  • 也支持从第一页爬取到上一次开始爬取的位置
  • 支持设置爬取的图片类型(全部、横图、竖图、正方形)
  • 支持最大或最小图片尺寸宽高比限制
  • 支持限制爬取的图片体积
  • 按照当天的日期创建目录并存放爬取的图片
  • 爬取结束后会在图片目录下生成日志文件
  • 支持tag搜索与排除
  • (可选)GUI

如何使用

可选

编辑config.jsonfolder_path参数,设为自己想要的目录,如文件夹不存在将会自动创建。路径必须以斜杠结尾。

可接受的分隔符只有/\\\将被认为是转义字符而报错。

剩下的参数可以运行后根据提示修改。

Windows下命令行执行python index.pypython GUI.py均可,Linux下可直接执行。

注意事项

每次运行后config.jsonlast_stop_id参数会被自动修改为爬取到的第一张图片的ID,便于下一次爬取时只爬取新post,无论停止条件为ID或是页码。

更新日志

2.0

新增:tag搜索,图形界面与并行下载

1.0

终于完成了啦

About

yande.re图片爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%