Python Corpus.output_rules 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: Corpus

클래스/타입: Corpus

메소드/함수: output_rules

hotexamples.com에서의 예제들: 2

Python Corpus.output_rules - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 Corpus.Corpus.output_rules에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Corpus(30)

find(5)

get_postag_set(4)

read(3)

__init__(2)

verificarPlagio(2)

add_source_document(2)

add_target_document(2)

get_file_name(2)

buildCorpus(2)

emails_as_string(2)

dump(2)

preprocess(2)

get_data(2)

read_ner(2)

outputWords(1)

pickledumpwords(1)

output_rules(1)

ner(1)

outputPOStags(1)

nettoyer_texte(1)

most_frequent_word_by_year(1)

most_frequent_word_by_month(1)

most_frequent_word_by_day(1)

most_frequent_word(1)

most_frequent_trigrams(1)

most_frequent_content_words(1)

picklegetwords(1)

read_label(1)

prepapre_to_matrix(1)

search_ambiguous(1)

vectoriserDocCorpus(1)

url_to_dir(1)

train_word2vec(1)

tag_words_with_most_likely_parses(1)

spanishTags(1)

set_lista_texto(1)

save_json(1)

process(1)

save(1)

results(1)

resetSentStats(1)

read_word2vec(1)

read_prediction(1)

load_json(1)

read_data(1)

most_frequent_bigrams(1)

get_instances(1)

lemmatiserCorpus(1)

calculSimilarite(1)

예제 #1

파일 보기

파일: start.py 프로젝트: erkekin/Brilltag

tag_order = 1
print("TRAIN: Precision for DS" + str(tag_order) + " " + str(train_corpus.calculate_precision()))

print("Possible rules are generating...")
rules = PossibleRules(train_corpus.tags[:20]).rules  # just try first 20 words in the training corpus since it is expensive to walk through all the words
print(str(len(train_corpus.all_words_in_corpus)) + " words in training set.")

learned_rules_with_precision = []
for rule in rules:
    for i in range(100, 400):

        original_word = train_corpus.all_words_in_corpus[i]
        word_after = train_corpus.all_words_in_corpus[i + 1]

        rule_changed_any_tag = rule.apply(original_word, word_after, train_corpus.words)
        if rule_changed_any_tag is True:
            precision = train_corpus.calculate_precision()
            learned_rules_with_precision.append((rule, precision))
            print("Precision for " + rule.name + " is " + str(precision))

train_corpus.output_rules("./Output/rules.txt", learned_rules_with_precision)

print("Rules are trained succesfully...")

test_corpus = Corpus(["./dataset/TestSet/file9.txt", "./dataset/TestSet/file10.txt"])

test_corpus.tag_words_with_most_likely_parses()
tag_order = 1
print("TEST: Precision for DS" + str(tag_order) + " " + str(test_corpus.calculate_precision()))

예제 #2

파일 보기

파일: start.py 프로젝트: erkekin/Brilltag

rules = PossibleRules(
    train_corpus.tags[:20]
).rules  # just try first 20 words in the training corpus since it is expensive to walk through all the words
print(str(len(train_corpus.all_words_in_corpus)) + " words in training set.")

learned_rules_with_precision = []
for rule in rules:
    for i in range(100, 400):

        original_word = train_corpus.all_words_in_corpus[i]
        word_after = train_corpus.all_words_in_corpus[i + 1]

        rule_changed_any_tag = rule.apply(original_word, word_after,
                                          train_corpus.words)
        if rule_changed_any_tag is True:
            precision = train_corpus.calculate_precision()
            learned_rules_with_precision.append((rule, precision))
            print("Precision for " + rule.name + " is " + str(precision))

train_corpus.output_rules("./Output/rules.txt", learned_rules_with_precision)

print("Rules are trained succesfully...")

test_corpus = Corpus(
    ["./dataset/TestSet/file9.txt", "./dataset/TestSet/file10.txt"])

test_corpus.tag_words_with_most_likely_parses()
tag_order = 1
print("TEST: Precision for DS" + str(tag_order) + " " +
      str(test_corpus.calculate_precision()))