Python clean_text 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: HP_Master_Project.utils

메소드/함수: clean_text

hotexamples.com에서의 예제들: 11

Python clean_text - 11개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 HP_Master_Project.utils.clean_text에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def _parse_features(self, response):
     try:
         feature_list = []
         js_data = self.parse_js_data(response)
         features = js_data['description']['bullets']
         for feat in features:
             feature = feat['value']
             if ':' in feature:
                 feature_title = feature.split(':')[0]
                 feature_content = clean_text(self, feature.split(':')[1])
                 feature = {feature_title: feature_content}
                 feature_list.append(feature)
             else:
                 break
         return feature_list
     except Exception as e:
         self.log("Error while forming request for base product data: {}".format(traceback.format_exc()), WARNING)
         return None

예제 #2

파일 보기

파일: cdw.py 프로젝트: mksingh202/scrapy

    def _parse_features(self, response):
        features = []
        features_name = response.xpath(
            '//ul[@id="productSpecsContainer"]'
            '/li//label[contains(@for, "product_spec")]/text()').extract()
        for f_name in features_name:
            f_content = response.xpath('//ul[@id="productSpecsContainer"]'
                                       '/li/div[contains(@id, "product_spec")]'
                                       '/*[@aria-label="%s"]'
                                       '//text()' % f_name).extract()
            f_content = clean_list(self, f_content)
            if len(f_content) > 1:
                f_content_title = response.xpath(
                    '//ul[@id="productSpecsContainer"]'
                    '/li/div[contains(@id, "product_spec")]'
                    '/*[@aria-label="%s"]'
                    '//span[@class="strong"]/text()' % f_name).extract()
                f_content_title = clean_list(self, f_content_title)

                f_content_text = response.xpath(
                    '//ul[@id="productSpecsContainer"]'
                    '/li/div[contains(@id, "product_spec")]'
                    '/*[@aria-label="%s"]'
                    '//span[not(contains(@class,"strong"))]'
                    '/text()' % f_name).extract()
                f_content_text = clean_list(self, f_content_text)

                for f_c_title in f_content_title:
                    index = f_content_title.index(f_c_title)
                    feature = {
                        f_c_title.replace(":", ""): f_content_text[index]
                    }
                    features.append(feature)

            else:
                f_content = f_content[0]
                f_content = clean_text(self, f_content)
                feature = {f_name: f_content}
                features.append(feature)

        return features

예제 #3

파일 보기

파일: connection.py 프로젝트: realchief/Python3-Scrapy-for-multiple-Ecommerce-sites

    def _parse_features(self, response):
        features = []
        features_name = response.xpath('//ul[@id="productSpecsContainer"]'
                                       '/li//label[contains(@for, "product_spec")]/text()').extract()
        for f_name in features_name:
            f_content = response.xpath('//ul[@id="productSpecsContainer"]'
                                       '/li/div[contains(@id, "product_spec")]'
                                       '/*[@aria-label="%s"]'
                                       '//text()' % f_name).extract()
            f_content = clean_list(self, f_content)
            if len(f_content) > 1:
                f_content_title = response.xpath('//ul[@id="productSpecsContainer"]'
                                                 '/li/div[contains(@id, "product_spec")]'
                                                 '/*[@aria-label="%s"]'
                                                 '//span[@class="strong"]/text()' % f_name).extract()
                f_content_title = clean_list(self, f_content_title)

                f_content_text = response.xpath('//ul[@id="productSpecsContainer"]'
                                                '/li/div[contains(@id, "product_spec")]'
                                                '/*[@aria-label="%s"]'
                                                '//span[not(contains(@class,"strong"))]'
                                                '/text()' % f_name).extract()
                f_content_text = clean_list(self, f_content_text)

                for f_c_title in f_content_title:
                    index = f_content_title.index(f_c_title)
                    feature = {f_c_title.replace(":", ""): f_content_text[index]}
                    features.append(feature)

            else:
                f_content = f_content[0]
                f_content = clean_text(self, f_content)
                feature = {f_name: f_content}
                features.append(feature)

        return features

예제 #4

파일 보기

파일: connection.py 프로젝트: singhmaneesh/scrapy

 def _parse_retailer_key(self, response):
     retailer_key = extract_first(response.xpath('//span[@itemprop="sku"]/text()'))
     return clean_text(self, retailer_key)

예제 #5

파일 보기

파일: connection.py 프로젝트: singhmaneesh/scrapy

 def _parse_sku(self, response):
     sku = extract_first(response.xpath('//span[@itemprop="sku"]/text()'))
     return clean_text(self, sku)

예제 #6

파일 보기

파일: connection.py 프로젝트: singhmaneesh/scrapy

 def _parse_model(self, response):
     model = extract_first(response.xpath('//span[@itemprop="mpn"]/text()'))
     return clean_text(self, model)

예제 #7

파일 보기

파일: en-gb_john_lewis.py 프로젝트: fatica/scrapy

 def _parse_model(self, response):
     model_number = response.xpath(
         '//dt[@class="product-specification-list__label" and contains(text(),"Model")]/following::dd/text()'
     ).extract_first()
     if model_number:
         return clean_text(self, model_number)

예제 #8

파일 보기

파일: connection.py 프로젝트: realchief/Python3-Scrapy-for-multiple-Ecommerce-sites

 def _parse_retailer_key(self, response):
     retailer_key = extract_first(response.xpath('//span[@itemprop="sku"]/text()'))
     return clean_text(self, retailer_key)

예제 #9

파일 보기

파일: connection.py 프로젝트: realchief/Python3-Scrapy-for-multiple-Ecommerce-sites

 def _parse_sku(self, response):
     sku = extract_first(response.xpath('//span[@itemprop="sku"]/text()'))
     return clean_text(self, sku)

예제 #10

파일 보기

파일: connection.py 프로젝트: realchief/Python3-Scrapy-for-multiple-Ecommerce-sites

 def _parse_model(self, response):
     model = extract_first(response.xpath('//span[@itemprop="mpn"]/text()'))
     return clean_text(self, model)

예제 #11

파일 보기

파일: en_gb_agros.py 프로젝트: MetaLocatorOrg/scrapy

 def _parse_model(self, response):
     model = re.search('Model number:([^<]+)</p>', response.text)
     if model:
         model = model.group(1).strip()
         return clean_text(self, model)