def parse_attr(self, response): #print(response.text) try: Titulo = response.css('h2.entry-title > a ::text').get() Cantante = self.Limpia_titulo(Titulo) Fecha = response.css('div.entry-meta ::text').extract()[0].strip( ) + ' ' + response.css( 'div.entry-meta ::text').extract()[1].strip() Fecha = Fecha.strip() for alb in response.css('div.entry-content > p a'): Album = alb.css('::text').get() Album = self.get_Album(Album) Inf = alb.css('::attr(href)').get() imprime_datos(Titulo, Fecha, Cantante, Album, response.url, Inf) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, response.url, Inf, Fecha, self.id_domin) driver = webdriver.Chrome( 'C:\\Users\\APDIF\\Desktop\\chromedriver.exe') driver.get(Inf) Infringing_mega = Get_megaLink(driver) imprime_datos(Titulo, Fecha, Cantante, Album, response.url, Infringing_mega) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, response.url, Infringing_mega, Fecha, self.id_domin) except: pass
def mediaFire(self, response): Infringing = response.css( 'a.input.popsok ::attr(href)').extract_first().strip() imprime_datos(response.meta['Titulo'], '', response.meta['Cantante'], response.meta['Album'], response.meta['Referer'], Infringing) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(response.meta['Titulo'], response.meta['Cantante'], response.meta['Album'], response.meta['Referer'], Infringing, self.Fecha, self.id_domin)
def parse_attr(self, response): i = 0 Fecha = date.today().strftime("%d %B, %Y") for T in response.xpath(".//strong[contains(text(), 'MEGA')]"): i += 1 Titulo = self.Limpia_titulo(T.css('::text').get()) Cantante, Album = separa_titulo(Titulo, '–') if i == 1: padre = T.xpath('..') Infringing = padre.css('a ::attr(href)').get() imprime_datos(Titulo,'', Cantante, Album, response.meta['referer'], Infringing) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, response.meta['referer'], Infringing, Fecha, self.id_domin) # INGRESA AL INFRINGING POR MEDIO DE SELENIUM self.Datos_Selenium(Titulo, Cantante, Album, response.meta['referer'], Infringing, Fecha, i)
def Datos_Selenium(self,Titulo, Cantante, Album, Referer, Infringing, Fecha, i): driver = webdriver.Chrome('C:\\Users\\APDIF\\Desktop\\chromedriver.exe') driver.get(Infringing) Inf_short = driver.find_element_by_xpath("//div[@class='link-container']/a["+ str(i) +"]").text # SIGUE EL INFRINGING driver.get(Inf_short) # INGRESA INFRINGING A LA BD LOS DATOS imprime_datos(Titulo,'', Cantante, Album, Referer, Inf_short) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, Referer, Inf_short, Fecha, self.id_domin) Infringing_mega = Get_megaLink(driver) if Infringing_mega != False: # INGRESA INFRINGING A LA BD LOS DATOS imprime_datos(Titulo,'', Cantante, Album, Referer, Infringing_mega) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, Referer, Infringing_mega, Fecha, self.id_domin) driver.quit()
def parse_attr(self, response): infringing = response.css('a.btn-nwo ::attr(href)').get() #infringing = str(infringing,'utf-8') #infringing = self.give_emoji_free_text(infringing) #####VERIFICA SI ES UN LINK VÁLIDO##### if veri(infringing) == True: if c.existe_ref(response.meta['referer']) == False: imprime_datos(response.meta['Titulo'], response.meta['Fecha'], response.meta['Cantante'], response.meta['Cancion'], response.meta['referer'], infringing) if c.inserta_item(response.meta['Titulo'], response.meta['Cantante'], response.meta['Cancion'], response.meta['referer'], infringing, response.meta['Fecha'], self.id_domin) == True: v.muestra_item_guardado(response.meta['Titulo'])
def parse(self, response): print('##### PÁGINA #{} #####'.format(self._num_pagina)) #####RECORRE "ARTICLES"##### for art in response.css('article.item-list'): Titulo = art.css('h2 > a ::text').get() Titulo = self.Limpia_titulo(Titulo) Cantante, Album = separa_titulo(Titulo, '–') Titulo, Cantante, Album = self.acentos(Titulo, Cantante, Album) referer = art.css('h2 > a ::attr(href)').get() for a in art.css('p > a'): try: Inf = a.css('::attr(href)').get() if Inf.find('zippyshare') != -1: Infringing = self.zippy(Inf) imprime_datos(Titulo, '', Cantante, Album, referer, Infringing) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, referer, Infringing, self.Fecha, self.id_domin) elif Inf.find('mediafire') != -1: yield Request(Inf, meta={ 'Titulo': Titulo, 'Cantante': Cantante, 'Album': Album, 'Referer': referer }, callback=self.mediaFire) elif Inf.find('userscloud') != -1: Infringing = self.userCloud(Inf) imprime_datos(Titulo, '', Cantante, Album, referer, Infringing) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, referer, Infringing, self.Fecha, self.id_domin) except: continue #break next_page = response.css('span#tie-next-page > a ::attr(href)').get() if next_page: self._num_pagina += 1 yield response.follow(next_page, callback=self.parse)
def parse_attr(self, response): #print(response.text) i = 0 Titulos = [] Fecha = date.today().strftime("%d %B, %Y") driver = webdriver.Chrome( 'C:\\Users\\APDIF\\Desktop\\chromedriver.exe') driver.get(response.url) for str in driver.find_elements_by_xpath('//p/strong'): i += 1 if i % 2 != 0: Titulos.append(str.text) #print(str.text) else: continue i = 0 tam = len(Titulos) for a in driver.find_elements_by_css_selector('p > a'): #print(i) if i == 0: i += 1 continue if i == tam: break inf = a.get_attribute('href') driver.execute_script("window.open(arguments[0]);", inf) driver.switch_to.window(driver.window_handles[1]) time.sleep(1) Infringing_mega = driver.current_url driver.close() driver.switch_to.window(driver.window_handles[0]) Titulo = self.Limpia_titulo(Titulos[i]) Cantante, Album = separa_titulo(Titulo, '–') imprime_datos(Titulo, '', Cantante, Album, response.url, Infringing_mega) # INGRESA INFRINGING A LA BD LOS DATOS Inserta_Datos(Titulo, Cantante, Album, response.url, Infringing_mega, Fecha, self.id_domin) i += 1 driver.quit()