from bs4 import BeautifulSoup
from models.autor import Autor
import unidecode
import db
from request import Request
import re

reqs = Request('https://www.frasesfamosas.com.br')
reqs.adiciona_url_completo('frases_autores', 'frases-de/')
reqs.adiciona_url_completo('buscar_frases', 'buscar-frases/')

autores = db.session.query(Autor)
ultimo_autor_com_link_alternativo = db.session.query(Autor).filter(
    Autor.link_alternativo_autor != ''
    or Autor.link_alternativo_autor != None).order_by(
        Autor.id_autor.desc()).first()

for autor in autores:
    if (ultimo_autor_com_link_alternativo == None
            or autor.id_autor > ultimo_autor_com_link_alternativo.id_autor):

        nome_autor_unicode = autor.autor

        nome_autor_lowercase = nome_autor_unicode.lower()

        nome_autor_tratado = re.sub(
            r"[^a-zA-Z0-9 -çÇáàÁÀéèÉÈíìÍÌóòÓÒúùÚÙâãÂÃêẽÊẼĩĨîÎõÕÔôũŨÛûöÖōñÑüÜïÏäÄëË]+[°ºª]",
            '', nome_autor_lowercase)

        nome_autor_correto = nome_autor_tratado.replace(' ', '-')
Ejemplo n.º 2
0
from bs4 import BeautifulSoup
from models.autor import Autor
from models.frase import Frase
from models.categorias_frases import CategoriasFrases
from models.categoria import Categoria
import unidecode
import db
from request import Request
import re

reqs = Request('https://www.frasesfamosas.com.br')
reqs.adiciona_url_completo('frases_autores', 'frases-de/')
reqs.adiciona_url_completo('frase_completa', 'frase/')

autores = db.session.query(Autor).order_by(Autor.id_autor.asc())

# autores bloquear:
# donald j trump
# sergio fernando moro

total_autores = len(autores)
autor_atual = 1

for autor in autores:
    # print(autor.link_alternativo_autor)
    if (autor.link_alternativo_autor != None):
        caminho = '{0}/'.format(autor.link_alternativo_autor)
        # print(autor)
        # break
    else: