Python HtmlResponse.statusの例

プログラミング言語: Python

名前空間/パッケージ名: scrapy.http

クラス/型: HtmlResponse

メソッド/関数: status

hotexamples.comのコード掲載数: 2

Python HtmlResponse.status - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのscrapy.http.HtmlResponse.statusの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

HtmlResponse(30)

css(30)

xpath(30)

follow(23)

urljoin(22)

json(16)

request(13)

body_as_unicode(9)

follow_all(6)

meta2(3)

_status(2)

_set_body(2)

copy(2)

flags(1)

_get_url(1)

encoding(1)

driver(1)

read(1)

replace(1)

status(1)

status_code(1)

url_list(1)

browser(1)

headers(1)

コード例 #1

ファイルを表示

def test_spider_crawls_links(spider, scrape_request, html_headers,
                             mock_html_twolinks):
    """Ensure spider always picks up relevant links to HTML pages"""
    # Use only 1 user agent for easier counting
    ua = factories.BatchUserAgentFactory.build(ua_string='Firefox / 11.0')
    spider.batch_user_agents = [ua]

    # Generate a mock response based on html containing two links
    mock_response = HtmlResponse(url='http://test:12345',
                                 body=mock_html_twolinks,
                                 encoding='utf-8')
    mock_response.request = scrape_request
    mock_response.headers = html_headers
    mock_response.meta['user_agent'] = ua
    mock_response.meta['sitescan'] = factories.SiteScanFactory()
    mock_response.status = 200
    mock_response.flags = []

    # Call spider on the mock response
    pipeline_generator = spider.parse(mock_response)

    # We should have two new requests and one MarkupItem
    sites_expected = set([
        mock_response.url + '/link1.html',
        mock_response.url + '/link2.html',
    ])

    sites_collected = []
    for elem in pipeline_generator:
        if isinstance(elem, Request):
            sites_collected.append(elem.url)
        else:
            assert isinstance(elem, MarkupItem)

    assert sites_expected == set(sites_collected)

コード例 #2

ファイルを表示

ファイル: test_spider.py プロジェクト: hallvors/spade

def test_spider_crawls_links(spider, scrape_request, html_headers,
                             mock_html_twolinks):
    """Ensure spider always picks up relevant links to HTML pages"""
    # Use only 1 user agent for easier counting
    ua = factories.BatchUserAgentFactory.build(ua_string='Firefox / 11.0')
    spider.batch_user_agents = [ua]

    # Generate a mock response based on html containing two links
    mock_response = HtmlResponse(url='http://test:12345',
                                 body=mock_html_twolinks,
                                 encoding='utf-8')
    mock_response.request = scrape_request
    mock_response.headers = html_headers
    mock_response.meta['user_agent'] = ua
    mock_response.meta['sitescan'] = factories.SiteScanFactory()
    mock_response.status = 200
    mock_response.flags = []

    # Call spider on the mock response
    pipeline_generator = spider.parse(mock_response)

    # We should have two new requests and one MarkupItem
    sites_expected = set([
        mock_response.url + '/link1.html',
        mock_response.url + '/link2.html',
    ])

    sites_collected = []
    for elem in pipeline_generator:
        if isinstance(elem, Request):
            sites_collected.append(elem.url)
        else:
            assert isinstance(elem, MarkupItem)

    assert sites_expected == set(sites_collected)