Python Selector.re_first示例

编程语言: Python

命名空间/包名称: scrapy

类/类型: Selector

方法/功能: re_first

hotexamples.com的示例: 2

Python Selector.re_first - 已找到2个示例。这些是从开源项目中提取的最受好评的scrapy.Selector.re_first现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Selector(30)

css(30)

split(30)

xpath(30)

re(24)

extract(22)

replace(11)

strip(9)

__len__(8)

remove_namespaces(7)

startswith(7)

find(6)

select(6)

__contains__(4)

extract_first(3)

index(3)

append(2)

register_namespace(2)

re_first(2)

group(2)

get(2)

findall(2)

endswith(1)

rsplit(1)

json(1)

select_by_visible_text(1)

isdigit(1)

示例#1

显示文件

文件： spider.py 项目： OleksandrKvitka/python_lab_2

 def parse_thread_pages(self, response):
     sel = Selector(response) \
         .xpath("//div[contains(@class, 'pagenav')]/table/tr/td[contains(@nowrap, 'nowrap')]/a/@href")
     pages = sel.re_first(r'.*page=(\d+)')
     link = sel.re_first(r'(.*page=).*')
     if pages is None:
         yield from self.parse_thread_messages(response)
     else:
         for p in range(int(pages)):
             url = response.urljoin(link + str(p + 1))
             request = scrapy.Request(url, callback=self.parse_thread_messages)
             request.meta['topic'] = response.meta['topic']
             yield request

示例#2

显示文件

 def parse_thread_pages(self, response):
     sel = Selector(response) \
         .xpath("//a[contains(@class,'navPages)]/@href")
     pages = sel.re_first(r'.*topic=(\d+\.\d+)')
     link = sel.re_first(r'(.*topic=).*')
     if pages is None:
         yield from self.parse_thread_messages(response)
     else:
         for p in range(int(pages)):
             url = response.urljoin(link + str((p + 1) * 40))
             request = scrapy.Request(url,
                                      callback=self.parse_thread_messages)
             request.meta['topic'] = response.meta['topic']
             yield request