Пример #1
0
 def parse_attr(self, response):
     #print(response.text)
     try:
         Titulo = response.css('h2.entry-title > a ::text').get()
         Cantante = self.Limpia_titulo(Titulo)
         Fecha = response.css('div.entry-meta ::text').extract()[0].strip(
         ) + ' ' + response.css(
             'div.entry-meta ::text').extract()[1].strip()
         Fecha = Fecha.strip()
         for alb in response.css('div.entry-content > p a'):
             Album = alb.css('::text').get()
             Album = self.get_Album(Album)
             Inf = alb.css('::attr(href)').get()
             imprime_datos(Titulo, Fecha, Cantante, Album, response.url,
                           Inf)
             # INGRESA INFRINGING A LA BD LOS DATOS
             Inserta_Datos(Titulo, Cantante, Album, response.url, Inf,
                           Fecha, self.id_domin)
         driver = webdriver.Chrome(
             'C:\\Users\\APDIF\\Desktop\\chromedriver.exe')
         driver.get(Inf)
         Infringing_mega = Get_megaLink(driver)
         imprime_datos(Titulo, Fecha, Cantante, Album, response.url,
                       Infringing_mega)
         # INGRESA INFRINGING A LA BD LOS DATOS
         Inserta_Datos(Titulo, Cantante, Album, response.url,
                       Infringing_mega, Fecha, self.id_domin)
     except:
         pass
Пример #2
0
 def mediaFire(self, response):
     Infringing = response.css(
         'a.input.popsok ::attr(href)').extract_first().strip()
     imprime_datos(response.meta['Titulo'], '', response.meta['Cantante'],
                   response.meta['Album'], response.meta['Referer'],
                   Infringing)
     # INGRESA INFRINGING A LA BD LOS DATOS
     Inserta_Datos(response.meta['Titulo'], response.meta['Cantante'],
                   response.meta['Album'], response.meta['Referer'],
                   Infringing, self.Fecha, self.id_domin)
Пример #3
0
 def parse_attr(self, response):
     i = 0
     Fecha = date.today().strftime("%d %B, %Y")
     for T in response.xpath(".//strong[contains(text(), 'MEGA')]"):
         i += 1
         Titulo = self.Limpia_titulo(T.css('::text').get())
         Cantante, Album = separa_titulo(Titulo, '–')
         if i == 1:
             padre = T.xpath('..')
             Infringing = padre.css('a ::attr(href)').get()
             imprime_datos(Titulo,'', Cantante, Album, response.meta['referer'], Infringing)
             # INGRESA INFRINGING A LA BD LOS DATOS
             Inserta_Datos(Titulo, Cantante, Album, response.meta['referer'], Infringing, Fecha, self.id_domin)
         # INGRESA AL INFRINGING POR MEDIO DE SELENIUM
         self.Datos_Selenium(Titulo, Cantante, Album, response.meta['referer'], Infringing, Fecha, i)
Пример #4
0
 def Datos_Selenium(self,Titulo, Cantante, Album, Referer, Infringing, Fecha, i):
     driver = webdriver.Chrome('C:\\Users\\APDIF\\Desktop\\chromedriver.exe')
     driver.get(Infringing)
     Inf_short = driver.find_element_by_xpath("//div[@class='link-container']/a["+ str(i) +"]").text
     # SIGUE EL INFRINGING
     driver.get(Inf_short)
     # INGRESA INFRINGING A LA BD LOS DATOS
     imprime_datos(Titulo,'', Cantante, Album, Referer, Inf_short)
     # INGRESA INFRINGING A LA BD LOS DATOS
     Inserta_Datos(Titulo, Cantante, Album, Referer, Inf_short, Fecha, self.id_domin)
     Infringing_mega = Get_megaLink(driver)
     if Infringing_mega != False:
         # INGRESA INFRINGING A LA BD LOS DATOS
         imprime_datos(Titulo,'', Cantante, Album, Referer, Infringing_mega)
         # INGRESA INFRINGING A LA BD LOS DATOS
         Inserta_Datos(Titulo, Cantante, Album, Referer, Infringing_mega, Fecha, self.id_domin)
     driver.quit()
Пример #5
0
 def parse_attr(self, response):
     infringing = response.css('a.btn-nwo ::attr(href)').get()
     #infringing = str(infringing,'utf-8')
     #infringing = self.give_emoji_free_text(infringing)
     #####VERIFICA SI ES UN LINK VÁLIDO#####
     if veri(infringing) == True:
         if c.existe_ref(response.meta['referer']) == False:
             imprime_datos(response.meta['Titulo'], response.meta['Fecha'],
                           response.meta['Cantante'],
                           response.meta['Cancion'],
                           response.meta['referer'], infringing)
             if c.inserta_item(response.meta['Titulo'],
                               response.meta['Cantante'],
                               response.meta['Cancion'],
                               response.meta['referer'], infringing,
                               response.meta['Fecha'],
                               self.id_domin) == True:
                 v.muestra_item_guardado(response.meta['Titulo'])
Пример #6
0
    def parse(self, response):
        print('##### PÁGINA #{} #####'.format(self._num_pagina))
        #####RECORRE "ARTICLES"#####
        for art in response.css('article.item-list'):
            Titulo = art.css('h2 > a ::text').get()
            Titulo = self.Limpia_titulo(Titulo)
            Cantante, Album = separa_titulo(Titulo, '–')
            Titulo, Cantante, Album = self.acentos(Titulo, Cantante, Album)
            referer = art.css('h2 > a ::attr(href)').get()
            for a in art.css('p > a'):
                try:
                    Inf = a.css('::attr(href)').get()
                    if Inf.find('zippyshare') != -1:
                        Infringing = self.zippy(Inf)
                        imprime_datos(Titulo, '', Cantante, Album, referer,
                                      Infringing)
                        # INGRESA INFRINGING A LA BD LOS DATOS
                        Inserta_Datos(Titulo, Cantante, Album, referer,
                                      Infringing, self.Fecha, self.id_domin)
                    elif Inf.find('mediafire') != -1:
                        yield Request(Inf,
                                      meta={
                                          'Titulo': Titulo,
                                          'Cantante': Cantante,
                                          'Album': Album,
                                          'Referer': referer
                                      },
                                      callback=self.mediaFire)
                    elif Inf.find('userscloud') != -1:
                        Infringing = self.userCloud(Inf)
                        imprime_datos(Titulo, '', Cantante, Album, referer,
                                      Infringing)
                        # INGRESA INFRINGING A LA BD LOS DATOS
                        Inserta_Datos(Titulo, Cantante, Album, referer,
                                      Infringing, self.Fecha, self.id_domin)
                except:
                    continue
            #break

        next_page = response.css('span#tie-next-page > a ::attr(href)').get()
        if next_page:
            self._num_pagina += 1
            yield response.follow(next_page, callback=self.parse)
Пример #7
0
 def parse_attr(self, response):
     #print(response.text)
     i = 0
     Titulos = []
     Fecha = date.today().strftime("%d %B, %Y")
     driver = webdriver.Chrome(
         'C:\\Users\\APDIF\\Desktop\\chromedriver.exe')
     driver.get(response.url)
     for str in driver.find_elements_by_xpath('//p/strong'):
         i += 1
         if i % 2 != 0:
             Titulos.append(str.text)
             #print(str.text)
         else:
             continue
     i = 0
     tam = len(Titulos)
     for a in driver.find_elements_by_css_selector('p > a'):
         #print(i)
         if i == 0:
             i += 1
             continue
         if i == tam:
             break
         inf = a.get_attribute('href')
         driver.execute_script("window.open(arguments[0]);", inf)
         driver.switch_to.window(driver.window_handles[1])
         time.sleep(1)
         Infringing_mega = driver.current_url
         driver.close()
         driver.switch_to.window(driver.window_handles[0])
         Titulo = self.Limpia_titulo(Titulos[i])
         Cantante, Album = separa_titulo(Titulo, '–')
         imprime_datos(Titulo, '', Cantante, Album, response.url,
                       Infringing_mega)
         # INGRESA INFRINGING A LA BD LOS DATOS
         Inserta_Datos(Titulo, Cantante, Album, response.url,
                       Infringing_mega, Fecha, self.id_domin)
         i += 1
     driver.quit()