Python Traph.get_webentity_pages 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: traph

클래스/타입: Traph

메소드/함수: get_webentity_pages

hotexamples.com에서의 예제들: 2

Python Traph.get_webentity_pages - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 traph.Traph.get_webentity_pages에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Traph(6)

add_page(5)

create_webentity(3)

add_links(3)

get_webentity_pages(2)

close(2)

index_batch_crawl(2)

retrieve_webentity(1)

retrieve_prefix(1)

remove_webentity_creation_rule(1)

pages_iter(1)

move_prefix_to_webentity(1)

make_traph(1)

links_iter(1)

get_webentity_parent_webentities(1)

get_webentity_most_linked_pages(1)

get_webentity_pagelinks(1)

get_webentity_outlinks(1)

get_webentity_inlinks(1)

get_webentity_crawled_pages(1)

get_webentity_child_webentities(1)

get_webentity_by_prefix(1)

get_webentities_links(1)

get_page_links(1)

delete_webentity(1)

add_webentity_creation_rule(1)

webentity_prefix_iter(1)

예제 #1

파일 보기

    path_size = random.choice(path_sizes)
    protocol = 's:http|'
    tld = 'h:com|'
    host = 'h:%s|' % (random.choice(voc))
    path = ''
    for p in range(path_size):
        path += 'p:%s|' % (random.choice(voc))
    lru = protocol + tld + host + path
    # print lru
    report = traph.add_page(lru)
    webentity_store.data['webentities'].update(report.created_webentities)

print '\n:: Webentities'
print '\nExisting webentities from Store:'
for weid, prefixes in webentity_store.data['webentities'].items():
    print ' - Webentity %s:' % (weid)
    for prefix in prefixes:
        print '\t\t' + prefix

print '\nPrefixes from Traph:'
for node, lru in traph.webentity_prefix_iter():
    print ' - (%s) \t%s' % (node.webentity(), lru)

print '\n:: Pages in "Lorem" webentity'
lorem_weid = traph.get_webentity_by_prefix('s:http|h:com|h:lorem|')
lorem_prefixes = webentity_store.data['webentities'][lorem_weid]
for lru in traph.get_webentity_pages(lorem_weid, lorem_prefixes):
    print ' - %s' % (lru)

traph.close()

예제 #2

파일 보기

파일: example_lorem_ipsum.py 프로젝트: CDonnees/hyphe-traph

print '- %s pages in the Traph' % (len(pages))

print '\n:: Traph: LRU trie'
print traph.lru_trie.representation()

print '\n:: Breakdown by webentity'
for weid in webentities:
    print '\nWebentity %s' % (weid)

    we_prefixes = webentity_store.data['webentities'][weid]
    print ' - %s prefixes (store)' % (len(we_prefixes))

    for prefix in we_prefixes:
        print ' \t- %s' % (prefix)

    we_pages = traph.get_webentity_pages(weid, we_prefixes)
    print ' - %s pages (traph)' % (len(we_pages))

    for lru in we_pages:
        print ' \t- %s' % (lru)

    we_crawled_pages = traph.get_webentity_crawled_pages(weid, we_prefixes)
    print ' - %s crawled pages (traph)' % (len(we_crawled_pages))

    for lru in we_crawled_pages:
        print ' \t- %s' % (lru)

    we_most_linked_pages = traph.get_webentity_most_linked_pages(
        weid, we_prefixes, 3)
    print ' - %s most linked pages (traph, max 3)' % (
        len(we_most_linked_pages))