Projeto

Crawler para extração de dados da URL https://revistaautoesporte.globo.com/rss/ultimas/feed.xml conforme solicitado no desafio da infoblogo na url https://github.com/Infoglobo/desafio-back-end.

Configuração

Pré-requisitos
- Python3
- Docker

Execute os comando abaixo para execução do projeto.

# git clone https://github.com/claytonsands/infoglobo
# cd infoglobo
# docker-compose up
# pip install -r requirements.txt
# python manage.py runserver

Com isso já será possivel acessar a URL http://127.0.0.1:8000 é ver a interface de manipulação REST conforme imagem abaixo.

Para acesso a api é necessário que seja realizada a criação de um usuário, execute o comando abaixo no seu terminal para criação de um superuser.

# python manage.py createsuperuser

Crawler

Para extrair o json do crawler execute o comando abaixo. Ele criará um arquivo com o nome infoglobo.jsonlines na raiz do projeto contendo os dados extraidos.

scrapy runspider infoglobo\crawling\crawler.py -o infoglobo.jsonlines

Além da criação do arquivo, o script crawler.py realiza a inserção dos dados extraidos no banco de dados do mongoDB (crawler.feed) anteriormente criado via docker-compose, tornando viavel a manipulação dele atrávez da API REST citada acima (EM DESENVOLVIMENTO).

Test

Para realizar teste execute o comando abaixo.

python manage.py test

PS: Apresentando FAIL em decorrencia de alteração realizada na model para conexão com o mongodb antes inexistente, não foi possivel corrigir por conta do esgotamento do tempo de entrega solicitado.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
crawler		crawler
infoglobo		infoglobo
README.md		README.md
db.sqlite3		db.sqlite3
docker-compose.yml		docker-compose.yml
manage.py		manage.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

crawler

crawler

infoglobo

infoglobo

README.md

README.md

db.sqlite3

db.sqlite3

docker-compose.yml

docker-compose.yml

manage.py

manage.py

requirements.txt

requirements.txt

Repository files navigation

Projeto

Configuração

Crawler

Test

About

Releases

Packages

Languages

claytonsands/infoglobo

Folders and files

Latest commit

History

Repository files navigation

Projeto

Configuração

Crawler

Test

About

Resources

Stars

Watchers

Forks

Languages