Esempi in Python per Selector.remove

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: scrapy.selector

Classe/tipologia: Selector

Metodo/funzione: remove

Esempi su hotexamples.com: 4

Selector.remove in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per scrapy.selector.Selector.remove, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Selector(30)

strip(30)

split(30)

css(30)

select(30)

replace(30)

extract(30)

re(30)

extract_first(19)

remove_namespaces(16)

index(9)

rstrip(9)

lstrip(9)

encode(8)

register_namespace(6)

find(5)

remove(4)

append(4)

startswith(3)

rindex(3)

extend(3)

get(3)

re_first(2)

getall(2)

lower(2)

pop(1)

partition(1)

extract_unquoted(1)

__getattribute__(1)

rfind(1)

items(1)

decode(1)

find_all(1)

group(1)

__len__(1)

title(1)

to_csv(1)

url(1)

Esempio n. 1

Mostra file

File: movie.py Progetto: 51fx/Python004

    def parse(self, response):
        # 解析页面
        movie_name_list = Selector(response=response).xpath(
            '//dd/div[1]/div[2]/a/div/div[1]/span[1]/text()').extract()
        movie_type_list = Selector(response=response).xpath(
            '//dd/div[1]/div[2]/a/div/div[2]/text()').extract()
        movie_time_list = Selector(response=response).xpath(
            '//dd/div[1]/div[2]/a/div/div[4]/text()').extract()

        # 去除换行、空格
        movie_type_list = eval(
            str(movie_type_list).replace(' ', '').replace('\\n', ''))
        movie_time_list = eval(
            str(movie_time_list).replace(' ', '').replace('\\n', ''))
        for ele in movie_type_list:
            if len(ele) == 0:
                movie_type_list.remove(ele)
                movie_time_list.remove(ele)

        items = []
        for index in range(10):
            item = Homework2Item(movie_name=movie_name_list[index],
                                 movie_type=movie_type_list[index],
                                 movie_time=movie_time_list[index])
            items.append(item)
        return items

Esempio n. 2

Mostra file

File: fresh.py Progetto: jzhao1998/freshSpider

def scrapyContent(filename):
    body = open(filename, 'r').read()
    itemName = Selector(
        text=body).xpath("/html/body/div/div[3]//img//@alt").extract()
    imageUrlList = Selector(
        text=body).xpath('//img/@data-ks-lazyload').extract()
    itemUrlList = Selector(
        text=body).xpath("/html/body/div/div[3]//dt/a//@href").extract()
    #使用图片的名字可以防止一些空格（detail的a中的名字可能有很多空格）
    for i in itemName[0:60]:
        print(i.replace('\\"', ""))
    #保存图片，图片名字由数字命名，之后可以换成其他的名字
    j = 0
    """
    for i in imageUrlList:
        filename=i.replace('\\"',"")[2:]
        print("http://"+filename)
        saveImage("http://"+filename,"image/"+str(j)+".jpg")
        j+=1
    """
    for i in itemUrlList:
        if (i[2:4] != "//"):
            itemUrlList.remove(i)
    for i in itemUrlList[0:60]:
        itemUrl = "https:" + i.replace('\\"', "")
        print(itemUrl)

Esempio n. 3

Mostra file

File: DoctoralAdvisors.py Progetto: sabidib/DoctoralAdvisors

 def getAdvisorData(self,response):
     nameLink = Selector(text=response.text).xpath(self.nameAndLinks).extract()
     for m in [u'mw-redirect',"new"]:
         try:
             nameLink.remove(m);
         except:
             None;
     nameLinkSorted = [[j,i] for i,j in zip(nameLink[::2], nameLink[1::2])];
     return nameLinkSorted;

Esempio n. 4

Mostra file

File: spider_flightgirl.py Progetto: mage1028/weibo_fakenews

    def parse_comments(self, response):

        item = CommentsItem()
        item['id'] = response.meta['id']
        item['flag'] = response.meta['flag']
        item['author'] = []
        item['author_comment'] = []
        item['time'] = []

        text = response.text
        restojson = json.loads(text, encoding='utf-8')
        html = restojson['data']['html']
        html = html.split('\\n')
        html = ''.join(html)
        author_comments = Selector(
            text=html).xpath('//*[@class="WB_text"]').extract()

        for author_comment in author_comments:

            item['author'].append(
                Selector(text=author_comment).xpath('//a/text()').extract()[0])
            remove_author = Selector(
                text=author_comment).xpath('//a/text()').extract()[0]

            author_comment = dealcontent(author_comment)
            comment = Selector(text=author_comment).xpath('//text()').extract()
            comment.remove(remove_author)
            comment = ''.join(comment)

            while re.match(r'^ ', comment):
                comment = comment.strip(' ')

            item['author_comment'].append(comment)

        if item['flag'] == 'forwarded':
            item['time'] = Selector(text=html).xpath(
                '//*[@class="WB_from S_txt2"]/a/@title').extract()
        if item['flag'] == 'comment':
            item['time'] = Selector(text=html).xpath(
                '//*[@class="WB_from S_txt2"]/text()').extract()

        item['like_count'] = Selector(text=html).xpath(
            '////span[@node-type="like_status"]/em[2]/text()').extract()
        lens = len(item['like_count'])

        for i in range(0, lens):
            item['like_count'][i] = item['like_count'][i].replace('赞', '0')

        yield copy.deepcopy(item)