Python get_content 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: content_extractor

메소드/함수: get_content

hotexamples.com에서의 예제들: 2

Python get_content - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 content_extractor.get_content에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: client.py 프로젝트: hellking4u/RecoSys

def main(url, log):
    log1 = log
    while True:
        if not os.path.exists(log1):
            os.makedirs(log1)
            break
        else : log1 = log1+'_'
    content = content_extractor.get_content(url)

    logFile = open(log1+'/metadata',"a")
    logFile.write("URL : "+url+"\n\n")
    logFile.write("Title : "+content['title']+"\n\n")
    logFile.write("Meta Desc. : "+content['meta']+"\n\n")
    logFile.write("Content : "+content['content'].encode("utf8")+"\n\n")
    logFile.close()

    d = TextRank.text_rank(content['content'])
    sortd = sorted(d.iteritems(), key = operator.itemgetter(1), reverse=True)

    logtext = open(log1+'/textrank_result',"a")
    logtext.write(str(sortd))
    logtext.close()

    final=[]
    for i in sortd:
        for j in range(len(source_probs)):
            final.append((i[0], j, i[1]*source_probs[j]))

    fsort = sorted(final, key = operator.itemgetter(2), reverse=True)
    logres = open(log1+'/result',"a")
    logres.write(str(fsort))
    logres.close()
    server.run_server(fsort[:10])

예제 #2

파일 보기

파일: custom_search.py 프로젝트: hellking4u/RecoSys

def get_wiki_article(search_term, verbose=False, search_list=default_list):
    content_list = []
    if verbose:
        print "Begin Search Algorithm for keyword : ", search_term
    for provider in search_list:
        if provider != "random":
            search_url_generator =  search(search_term+" "+provider, stop=1)
            root_url = search_url_generator.next()
            if verbose:
                print "Looking at Encyclopedia Article :", root_url
            term = content_extractor.get_content(root_url)
            def_size = len(term['content'])
            if verbose:
                print term['meta'].encode('utf-8', errors='replace')
            content_list.append(term['content'])
        else:
            print "Random Text generation"
            content_list.append(random_text.get_random_text(def_size))

    return content_list