O NemLiNemLereiBot utiliza os plugins para extrair o metadata das notícias e de acordo com as idiossincrasias de cada site sem poluir o código do bot.
- http://estadao.com.br
- http://www1.folha.uol.com.br/ paywall
- http://www.gazetadopovo.com.br/
- https://g1.globo.com
- https://www.cartacapital.com.br -- [x] título -- [x] data -- [ ]conteúdo
- http://www.correiobraziliense.com.br/
- http://www.correio24horas.com.br/
-
http://www.dw.com/não é br - http://www.jb.com.br/ -- [x] título -- [x] data -- [ ]conteúdo
- http://www.jornaldebrasilia.com.br/
- https://www.tecmundo.com.br/ -- [x] título -- [x] data -- [x]conteúdo -- [ ] remover propagandas (cupons de desconto) do corpo do texto
-
https://www.theintercept.com/não é br
- Ir implementando (g1 é o mais utilizado);
Quantificar quais são os portais mais postados no sub;vide stats_ (mesmo assim tem mta noticia postada com outras flairs.... é possível que eu repasse o script)- Possivelmente refatorar parsers que sejam parecidos em mais de um site;
- Estatísticas de uso e qualidade de cada plugin (?);
- Manter;
Adicionar automaticamente a lista de plugins a ser implementados conforme posts novos com a flair 'notícia'.vide site_rank.py