Python Page.from_web_page Beispiele

Programmiersprache: Python

Namespace / Paketname: page

Klasse / Typ: Page

Methode / Funktion: from_web_page

Beispiele auf hotexamples.com: 4

Python Page.from_web_page - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die page.Page.from_web_page, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Page(30)

__init__(30)

content(8)

add_page(7)

addForm(5)

addBlockCenter(5)

button(4)

a(4)

body(4)

click(4)

create(4)

resources(3)

find(3)

in_index(3)

addBlockRight(3)

get_by_name(3)

close(2)

crawl(2)

import_tables(2)

data(2)

find_links_in_content(2)

gSoupToLinks(2)

index_num(2)

process_node(2)

scrap(2)

set_data(2)

click_add_new_product(2)

control(2)

all(2)

addScript(2)

add_html(2)

addBlockLeft(2)

_Icons(2)

_Name(2)

change_product_name(1)

parse_date(1)

navigate(1)

length(1)

is_valid(1)

insertThumbnail(1)

is_enabled(1)

print_form_results(1)

inflate(1)

add(1)

index(1)

parse_table(1)

printed_output(1)

print_info(1)

set_confidences(1)

validate(1)

Beispiel #1

Datei anzeigen

Datei: sources.py Projekt: tfgg/ppsay

def get_source_if_matches(source_url, source, state, conditions=[(1, 0, 0)], fresh=False):
    """
        Get a source and save it if there are matches.

        min_candidates, min_constituencies, min_parties
    """
    
    result = {
        'url': source_url,
        'source': source,
        'state': state
    }

    # First, get the parsed page object 
    page = Page.get_url(source_url)

    if page is not None:
        print "Page already exists."

        if not fresh:
            result['skip'] = {
                'text': 'Page already exists.'
            }

    else:
        print "Page doesn't exist"

        web_page = WebPage(source_url)

        try:
            web_page.fetch()
        except WebPage.FailedToFetch, e:
            result['error'] = {
                'type': 'WebPage.FailedToFetch',
                'text': str(e),
            }

        if web_page.is_local:
            result['skip'] = {
                'text': 'Already in cache',
            }
        else:
            try:
                page = Page.from_web_page(web_page, source)
                page.save()
            except Page.FetchError, e:
                print "FAILED", e
                result['error'] = {
                    'type': 'Page.FetchError',
                    'text': str(e),
                }

Beispiel #2

Datei anzeigen

def get_source_if_matches(source_url,
                          source,
                          state,
                          conditions=[(1, 0, 0)],
                          fresh=False):
    """
        Get a source and save it if there are matches.

        min_candidates, min_constituencies, min_parties
    """

    result = {'url': source_url, 'source': source, 'state': state}

    # First, get the parsed page object
    page = Page.get_url(source_url)

    if page is not None:
        print "Page already exists."

        if not fresh:
            result['skip'] = {'text': 'Page already exists.'}

    else:
        print "Page doesn't exist"

        web_page = WebPage(source_url)

        try:
            web_page.fetch()
        except WebPage.FailedToFetch, e:
            result['error'] = {
                'type': 'WebPage.FailedToFetch',
                'text': str(e),
            }

        if web_page.is_local:
            result['skip'] = {
                'text': 'Already in cache',
            }
        else:
            try:
                page = Page.from_web_page(web_page, source)
                page.save()
            except Page.FetchError, e:
                print "FAILED", e
                result['error'] = {
                    'type': 'Page.FetchError',
                    'text': str(e),
                }

Beispiel #3

Datei anzeigen

Datei: sources.py Projekt: tfgg/ppsay

        print >>sys.stderr, datetime.now(), result

    return result


def get_source(source_url, source, state):
    """
        Get a source and save it, no matter what.
    """
    
    web_page = WebPage(source_url)

    try:
        web_page.fetch()
    except WebPage.FailedToFetch, e:
        print "FAILED", e
        return None

    page = Page.from_web_page(web_page, source)
    page.save()

    new, article = get_or_create_doc([page])

    article.process() 

    article.state = state
    article.save()

    return article

Beispiel #4

Datei anzeigen

    if 'error' in result:
        print >> sys.stderr, datetime.now(), result

    return result


def get_source(source_url, source, state):
    """
        Get a source and save it, no matter what.
    """

    web_page = WebPage(source_url)

    try:
        web_page.fetch()
    except WebPage.FailedToFetch, e:
        print "FAILED", e
        return None

    page = Page.from_web_page(web_page, source)
    page.save()

    new, article = get_or_create_doc([page])

    article.process()

    article.state = state
    article.save()

    return article