Python ImageScraperItem примеры использования

Язык программирования: Python

Пространство имен/Пакет: imagescraper.items

Класс/Тип: ImageScraperItem

Примеров на hotexamples.com: 6

Python ImageScraperItem - 6 примеров найдено. Это лучшие примеры Python кода для imagescraper.items.ImageScraperItem, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

ImageScraperItem(6)

Основные методы

ImageScraperItem (6)

Пример #1

Показать файл

Файл: pixiv_illusts_direct.py Проект: derui/painter-tensorflow

    def parse(self, response):
        img = response.css('div.img-container').xpath('.//img')
        img_url = img.xpath('@src').extract_first()

        if img_url is not None:
            item = ImageScraperItem(
                file_urls=[img_url], files=[], response=response)

            yield item

Пример #2

Показать файл

        def _parse(response):
            file_url = response.xpath(
                '//div[@class="first-image"]/img/@src').extract_first()
            if file_url is not None and not self.__should_ignore(file_url):

                item = ImageScraperItem(
                    tags=[category],
                    file_urls=[urllib.parse.urljoin(response.url, file_url)],
                    files=[])

                yield item

Пример #3

Показать файл

        def _parse(response):
            file_url = response.xpath(
                '//img[contains(@class, "item_main")]/@src').extract_first()
            if file_url is not None and not self.__should_ignore(file_url):

                item = ImageScraperItem(
                    tags=[category],
                    file_urls=[urllib.parse.urljoin(response.url, file_url)],
                    files=[])

                yield item

Пример #4

Показать файл

    def parse(self, response):
        images = response.xpath(
            '//ul[@class="innerList"]//div[@class="imgWrap"]//img')

        for image in images:
            file_url = image.xpath('@src').extract_first()

            if file_url is not None and not self.__should_ignore(file_url):

                item = ImageScraperItem(tags=[url_tag_map[response.url]],
                                        file_urls=[file_url],
                                        files=[])

                yield item

Пример #5

Показать файл

        def _parse(response):
            json_content = response.xpath(
                '//div[starts-with(@id, "entitledItem_")]/text()'
            ).extract_first()
            file_url = None
            if json_content is not None:
                parsed = json.loads(json_content)
                file_url = parsed[0]["ItemImage"]

            if file_url is not None and not self.__should_ignore(file_url):

                item = ImageScraperItem(
                    tags=[category],
                    file_urls=[urllib.parse.urljoin(response.url, file_url)],
                    files=[])

                yield item

Пример #6

Показать файл

    def parse(self, response):
        posts = response.xpath('//post')

        for post in posts:
            file_url = 'http:' + post.xpath('@file_url').extract_first()
            tags = post.xpath('@tags').extract_first().split(' ')
            tags = list(filter(lambda x: x != '', tags))

            if file_url is not None and not self.__should_ignore(file_url):

                item = ImageScraperItem(
                    tags=tags,
                    file_urls=[file_url],
                    files=[]
                )

                yield item