from bs4 import BeautifulSoup from models.autor import Autor import unidecode import db from request import Request import re reqs = Request('https://www.frasesfamosas.com.br') reqs.adiciona_url_completo('frases_autores', 'frases-de/') reqs.adiciona_url_completo('buscar_frases', 'buscar-frases/') autores = db.session.query(Autor) ultimo_autor_com_link_alternativo = db.session.query(Autor).filter( Autor.link_alternativo_autor != '' or Autor.link_alternativo_autor != None).order_by( Autor.id_autor.desc()).first() for autor in autores: if (ultimo_autor_com_link_alternativo == None or autor.id_autor > ultimo_autor_com_link_alternativo.id_autor): nome_autor_unicode = autor.autor nome_autor_lowercase = nome_autor_unicode.lower() nome_autor_tratado = re.sub( r"[^a-zA-Z0-9 -çÇáàÁÀéèÉÈíìÍÌóòÓÒúùÚÙâãÂÃêẽÊẼĩĨîÎõÕÔôũŨÛûöÖōñÑüÜïÏäÄëË]+[°ºª]", '', nome_autor_lowercase) nome_autor_correto = nome_autor_tratado.replace(' ', '-')
from bs4 import BeautifulSoup from models.autor import Autor from models.frase import Frase from models.categorias_frases import CategoriasFrases from models.categoria import Categoria import unidecode import db from request import Request import re reqs = Request('https://www.frasesfamosas.com.br') reqs.adiciona_url_completo('frases_autores', 'frases-de/') reqs.adiciona_url_completo('frase_completa', 'frase/') autores = db.session.query(Autor).order_by(Autor.id_autor.asc()) # autores bloquear: # donald j trump # sergio fernando moro total_autores = len(autores) autor_atual = 1 for autor in autores: # print(autor.link_alternativo_autor) if (autor.link_alternativo_autor != None): caminho = '{0}/'.format(autor.link_alternativo_autor) # print(autor) # break else: