Python WordExtractor.save Beispiele

Programmiersprache: Python

Namespace / Paketname: soynlp.word

Klasse / Typ: WordExtractor

Methode / Funktion: save

Beispiele auf hotexamples.com: 2

Python WordExtractor.save - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die soynlp.word.WordExtractor.save, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

WordExtractor(30)

train(30)

extract(21)

word_scores(6)

load(5)

all_cohesion_scores(2)

save(2)

Beispiel #1

Datei anzeigen

Datei: unsupervised_nlputils.py Projekt: whpark70/embedding

def compute_soy_word_score(corpus_fname, model_fname):
    sentences = [sent.strip() for sent in open(corpus_fname, 'r').readlines()]
    word_extractor = WordExtractor(min_frequency=100,
                                   min_cohesion_forward=0.05,
                                   min_right_branching_entropy=0.0)
    word_extractor.train(sentences)
    word_extractor.save(model_fname)

Beispiel #2

Datei anzeigen

Datei: tokenizer_temp.py Projekt: WoohyunNoh/Edu_AI

from tensorflow.keras.preprocessing.text import text_to_word_sequence

data = pd.read_pickle('./backend/textengines/data/dc_data.pkl')

soynlp_model_fname = './backend/textengines/data/tokenizer_model/soyword.model'

sentences = data["title"].values

word_extractor = WordExtractor(
    min_frequency=100,
    min_cohesion_forward=0.05,
    min_right_branching_entropy=0.0
)

word_extractor.train(sentences)
word_extractor.save(soynlp_model_fname)

scores = word_extractor.word_scores()
scores = {key:(scores[key].cohesion_forward * math.exp(scores[key].right_branching_entropy)) for key in scores.keys()}
# soyToken = LTokenizer(scores=scores)
# soyToken.tokenize(data["title"].values[0])
#############################################################################
file = open("./backend/textengines/data/dc_title.txt", "w", encoding="utf-8")
for title in data["title"].values:
    file.write(title)
    file.write("\n")
file.close()

spm_train = """--input=./backend/textengines/data/dc_title.txt \
               --model_prefix=sentencepice \
               --vocab_size=32000 \