Python Document.filtered_sentences примеры использования

Язык программирования: Python

Пространство имен/Пакет: Document

Класс/Тип: Document

Метод/Функция: filtered_sentences

Примеров на hotexamples.com: 2

Python Document.filtered_sentences - 2 примера найдено. Это лучшие примеры Python кода для Document.Document.filtered_sentences, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Document(30)

all_sentences(11)

__str__(5)

__init__(4)

append(3)

addMention(2)

numOfWords(2)

generateWhole(2)

factory(2)

edit(2)

addMeSH(1)

get_candidates(1)

generate_candidate_anaphor_data(1)

generate_candidate_mention_pairs(1)

generate_document(1)

generate_gold_anaphor_data(1)

generate_gold_mention_pairs(1)

get(1)

getID(1)

getIdentifiant(1)

getUID(1)

get_article(1)

get_clean(1)

from_json(1)

get_cls_byname(1)

get_cluster_data(1)

get_stems(1)

name(1)

__dict__(1)

save_collection(1)

set_body_length(1)

set_url(1)

termFrequency(1)

to_json(1)

write2DB(1)

_edit(1)

from_data_frame(1)

addLien(1)

build_n_grams(1)

addRef(1)

addTexte(1)

addTitre(1)

add_anchor_text(1)

add_body_hits(1)

add_sentence(1)

allDocumentsID(1)

addDocument(1)

addAuteur(1)

availableReplacements(1)

calculate_vectors(1)

Пример #1

Показать файл

Файл: summarize.py Проект: Melih-Durmaz/scisumm

def summarize(document, all=True):
    doc = Document(document)
    sentences, offset = (doc.all_sentences()
                         if all else doc.filtered_sentences())

    # Ranker
    ranker = TextRank(sentences)
    ranker.rank()
    scores = ranker.scores

    # Selector
    summary = []
    sum_len = 0
    for x in range(num):
        idx = scores[x][0] + offset
        sent = doc[idx].sentence
        if sum_len + len(sent.split(' ')) > MAXLEN:
            break
        summary.append((sent, scores[x][1], doc.get_section_name(idx)))
        sum_len += len(sent.split(' '))
    text = ''
    logit("\nP10-1024")
    logit("\nAll Sentences" if all else "\nFiltered Sentences")
    logit("Length of summary : " + str(sum_len))
    for sent, score, section in summary:
        text += '\n' + "[" + section.encode('utf-8') + "] " + \
                sent.encode('utf-8')
        #"[" + str(score) + "] " + sent.encode('utf-8')
    logit(text)

    # Printer
    # this has to be automated
    file = DIR['BASE'] + "data/Summary.txt"
    with open(file, 'w') as sfile:
        sfile.write('\n'.join([sent
                               for sent, sc, sec in summary]).encode('utf-8'))

    # Evaluator
    guess_summary_list = [file]
    ref_summary_list = [[DIR['BASE'] + "data/P10-1024-Ref1.txt"]]
    recall, precision, F_measure = PythonROUGE(guess_summary_list,
                                               ref_summary_list,
                                               ngram_order=1)
    logit("Recall:{0} ; Precision:{1} ; F:{2}".format(recall, precision,
                                                      F_measure))

Пример #2

Показать файл

Файл: summarize.py Проект: junkmechanic/scisumm

def summarize(document, all=True):
    doc = Document(document)
    sentences, offset = (doc.all_sentences() if all
                         else doc.filtered_sentences())

    # Ranker
    ranker = TextRank(sentences)
    ranker.rank()
    scores = ranker.scores

    # Selector
    summary = []
    sum_len = 0
    for x in range(num):
        idx = scores[x][0] + offset
        sent = doc[idx].sentence
        if sum_len + len(sent.split(' ')) > MAXLEN:
            break
        summary.append((sent, scores[x][1], doc.get_section_name(idx)))
        sum_len += len(sent.split(' '))
    text = ''
    logit("\nP10-1024")
    logit("\nAll Sentences" if all else "\nFiltered Sentences")
    logit("Length of summary : " + str(sum_len))
    for sent, score, section in summary:
        text += '\n' + "[" + section.encode('utf-8') + "] " + \
                sent.encode('utf-8')
                #"[" + str(score) + "] " + sent.encode('utf-8')
    logit(text)

    # Printer
    # this has to be automated
    file = DIR['BASE'] + "data/Summary.txt"
    with open(file, 'w') as sfile:
        sfile.write('\n'.join([sent for sent, sc, sec in summary]).
                    encode('utf-8'))

    # Evaluator
    guess_summary_list = [file]
    ref_summary_list = [[DIR['BASE'] + "data/P10-1024-Ref1.txt"]]
    recall, precision, F_measure = PythonROUGE(guess_summary_list,
                                               ref_summary_list,
                                               ngram_order=1)
    logit("Recall:{0} ; Precision:{1} ; F:{2}".format(recall, precision,
                                                      F_measure))