Python IblSpider.parse примеры использования

Язык программирования: Python

Пространство имен/Пакет: slybot.spider

Класс/Тип: IblSpider

Метод/Функция: parse

Примеров на hotexamples.com: 8

Python IblSpider.parse - 8 примеров найдено. Это лучшие примеры Python кода для slybot.spider.IblSpider.parse, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

IblSpider(21)

parse(4)

handle_html(1)

Основные методы

IblSpider (21)

parse (4)

handle_html (1)

Пример #1

Показать файл

Файл: test_multiple_item_extraction.py Проект: ning1022/portia

 def test_extract_repeated_field(self):
     sample = {
         'plugins': {'annotations-plugin': {}},
         'url': 'https://stackoverflow.com',
         'original_body': re.sub(
             'data-scrapy-annotate=".*"', '', html_page._body),
         'scrapes': 'default',
         'page_id': '507f520c3bf361f4c5cd55c44307a271bccb2218',
         'version': '0.13.0'
     }
     data = open_spec('so_annotations.json')
     annos, items, results = data['annos'], data['items'], data['results']
     sample['plugins']['annotations-plugin']['extracts'] = annos
     spider = IblSpider('so', make_spider(sample=sample),
                        items, {}, Settings())
     page = HtmlResponse('http://url', body=sample['original_body'],
                         encoding='utf-8')
     items = [i for i in spider.parse(page) if not isinstance(i, Request)]
     keys = {(u'_index', u'_template', u'_type', u'answered', u'tags',
              u'title', 'url')}
     self.assertEqual({tuple(sorted(i.keys())) for i in items}, keys)
     self.assertEqual([items[0], items[52], items[-1]], results)
     self.assertEqual(len(items), 96)
     spider, page, results = open_spider_page_and_results('autoevolution.json')
     items = [i for i in spider.parse(page) if not isinstance(i, Request)]
     self.assertEqual(items, results)

Пример #2

Показать файл

Файл: test_multiple_item_extraction.py Проект: daqv/portia-dashboard

 def test_extract_repeated_field(self):
     sample = {
         'plugins': {'annotations-plugin': {}},
         'url': 'https://stackoverflow.com',
         'original_body': re.sub(
             'data-scrapy-annotate=".*"', '', html_page._body),
         'scrapes': 'default',
         'page_id': '507f520c3bf361f4c5cd55c44307a271bccb2218',
         'version': '0.13.0'
     }
     data = open_spec('so_annotations.json')
     annos, items, results = data['annos'], data['items'], data['results']
     sample['plugins']['annotations-plugin']['extracts'] = annos
     spider = IblSpider('so', make_spider(sample=sample),
                        items, {}, Settings())
     page = HtmlResponse('http://url', body=sample['original_body'],
                         encoding='utf-8')
     items = [i for i in spider.parse(page) if not isinstance(i, Request)]
     keys = {(u'_index', u'_template', u'_type', u'answered', u'tags',
              u'title', 'url')}
     self.assertEqual({tuple(sorted(i.keys())) for i in items}, keys)
     self.assertEqual([items[0], items[52], items[-1]], results)
     self.assertEqual(len(items), 96)
     spider, page, results = open_spider_page_and_results('autoevolution.json')
     items = [i for i in spider.parse(page) if not isinstance(i, Request)]
     self.assertEqual(items, results)

Пример #3

Показать файл

Файл: test_multiple_item_extraction.py Проект: Kumangus/portia

 def test_extract_multiple_item_types(self):
     spider = IblSpider('xceed', xceed_spider, xceed_spider['items'], {},
                        Settings())
     data = list(spider.parse(
         HtmlResponse('http://url',
                      body=xceed_spider['templates'][0]['original_body'],
                      encoding='utf-8')
     ))
     self.assertEqual(data[:6], xceed_spider['results'])

Пример #4

Показать файл

Файл: test_multiple_item_extraction.py Проект: ning1022/portia

 def test_extract_multiple_item_types(self):
     spider = IblSpider('xceed', xceed_spider, xceed_spider['items'], {},
                        Settings())
     data = list(spider.parse(
         HtmlResponse('http://url',
                      body=xceed_spider['templates'][0]['original_body'],
                      encoding='utf-8')
     ))
     items = [d for d in data if not isinstance(d, Request)]
     self.assertEqual(items, xceed_spider['results'])

Пример #5

Показать файл

Файл: test_multiple_item_extraction.py Проект: the-kids/portia

 def test_extract_multiple_item_types(self):
     spider = IblSpider('xceed', xceed_spider, xceed_spider['items'], {},
                        Settings())
     data = list(
         spider.parse(
             HtmlResponse(
                 'http://url',
                 body=xceed_spider['templates'][0]['original_body'],
                 encoding='utf-8')))
     self.assertEqual(data[:6], xceed_spider['results'])

Пример #6

Показать файл

Файл: test_multiple_item_extraction.py Проект: NamiStudio/portia

 def test_extract_multiple_item_types(self):
     spider = IblSpider('xceed', xceed_spider, xceed_spider['items'], {},
                        Settings())
     data = list(spider.parse(
         HtmlResponse('http://url',
                      body=xceed_spider['templates'][0]['original_body'],
                      encoding='utf-8')
     ))
     items = [d for d in data if not isinstance(d, Request)]
     self.assertEqual(items, xceed_spider['results'])

Пример #7

Показать файл

Файл: test_multiple_item_extraction.py Проект: daqv/portia-dashboard

 def test_extract_multiple_item_types(self):
     spider = IblSpider('xceed', xceed_spider, xceed_spider['items'], {},
                        Settings())
     data = list(spider.parse(
         HtmlResponse('http://url',
                      body=xceed_spider['templates'][0]['original_body'],
                      encoding='utf-8')
     ))
     items = sorted([d for d in data if not isinstance(d, Request)],
                    key=lambda x: ('ticket', 'venue', 'event').index(x['_type']))
     self.assertEqual(items, xceed_spider['results'])

Пример #8

Показать файл

Файл: test_multiple_item_extraction.py Проект: zniper/portia

 def test_extract_multiple_item_types(self):
     spider = IblSpider('xceed', xceed_spider, xceed_spider['items'], {},
                        Settings())
     data = list(spider.parse(
         HtmlResponse('http://url',
                      body=xceed_spider['templates'][0]['original_body'],
                      encoding='utf-8')
     ))
     items = sorted([d for d in data if not isinstance(d, Request)],
                    key=lambda x: ('ticket', 'venue', 'event').index(x['_type']))
     self.assertEqual(items, xceed_spider['results'])