Skip to content

qDes/books_parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Парсер книг с сайта tululu.org

Парсер скачивает и сохраняет книги в жанре фантастика.

Как установить

Для работы необходим python версии 3.6+.
Установка зависимостей:

pip3 install -r requirements.txt

Использование

При запуске скрипта указывается первая и последняя страница библиотеки сайта. Аргумент file указывает на файл описания библиотеки:

python3 parse_tululu_category.py --start_page %start_page% --end_page %end_page% --file %description.json%

Если не указать аргумент end_page парсер пройдёт до последней страницы.
После работы программы папка books/ содержит книги, папка images/ - обложки книг, файл description.json - описание скачанной библиотеки. Структура файла с описание библиотеки:

[
  {
      "title": "Название книги",
      "author": "Автор книги",
      "img_src": "images/обложка.жпг",
      "book_path": "books/книга.txt",
      "comments": ["комментарий1", "комментарий2"],
      "genres": ["жанр1", "жанр2"]
  }, 

]

Цель проекта

Код написан в образовательных целях на онлайн-курсе для веб-разработчиков dvmn.org.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages