Python Scraper.fromfileの例

プログラミング言語: Python

名前空間/パッケージ名: scrapely

クラス/型: Scraper

メソッド/関数: fromfile

hotexamples.comのコード掲載数: 3

Python Scraper.fromfile - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのscrapely.Scraper.fromfileの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Scraper(9)

scrape(9)

train(9)

fromfile(2)

scrape_page(2)

tofile(2)

train_from_htmlpage(2)

HtmlPage(1)

add_template(1)

コード例 #1

ファイルを表示

ファイル: scrape_steps.py プロジェクト: ludocracy/theme-plates-services

def get_scraper(
        url: str,
        scrapers_file_name: str = 'scrapers.json') -> Union[None, Scraper]:
    domain = get_domain(url)
    with open(get_file_path(scrapers_file_name), 'r') as scrapers_file:
        scrapers_json = json.load(scrapers_file)
        if domain in scrapers_json:
            scraper_file_name = scrapers_json[domain]
        else:
            return None

    with open(get_file_path(scraper_file_name), 'r') as scraper_file:
        return Scraper.fromfile(scraper_file)

コード例 #2

ファイルを表示

ファイル: test_scraper.py プロジェクト: netconstructor/scrapely

    def test_train_store_load_scrape(self):
        url1 = "http://www.icone.co.uk/lighting-suspension/copper-shade-by-tom-dixon/tom-dixon/tom-dixon/MSS45UKC/"
        data = {"name": "Copper Shade by Tom Dixon", "designer": "Tom Dixon", "price": "320"}
        s = Scraper()
        s.train(url1, data, encoding="latin1")

        f = StringIO()
        s.tofile(f)

        f.seek(0)
        s = Scraper.fromfile(f)

        url2 = "http://www.icone.co.uk/lighting-wall-and-ceiling/mesmeri-halo-chrome/artemide/eric-sole/0916024A/"
        data = s.scrape(url2, encoding="latin1")
        self.assertEqual(sorted(data[0].keys()), ["designer", "name", "price"])

コード例 #3

ファイルを表示

ファイル: test_scraper.py プロジェクト: xyb/scrapely

    def test_extraction(self):

        samples_encoding = 'latin1'
        [(html1, data1), (html2, data2)] = list(iter_samples(
            'scraper_loadstore', html_encoding=samples_encoding))
        sc = Scraper()
        page1 = HtmlPage(body=html1, encoding=samples_encoding)
        sc.train_from_htmlpage(page1, data1)

        page2 = HtmlPage(body=html2, encoding=samples_encoding)
        extracted_data = sc.scrape_page(page2)
        self._assert_extracted(extracted_data, data2)

        # check still works after serialize/deserialize 
        f = StringIO()
        sc.tofile(f)
        f.seek(0)
        sc = Scraper.fromfile(f)
        extracted_data = sc.scrape_page(page2)
        self._assert_extracted(extracted_data, data2)