Python Vocabulary.addSentenceの例

プログラミング言語: Python

名前空間/パッケージ名: vocabulary

クラス/型: Vocabulary

メソッド/関数: addSentence

hotexamples.comのコード掲載数: 1

Python Vocabulary.addSentence - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのvocabulary.Vocabulary.addSentenceの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Vocabulary(30)

add_word(15)

clean_text(8)

build_vocab(8)

add_words(8)

deserialize(7)

compile(4)

add(4)

antonym(4)

auto_punctuate(3)

add_token(3)

encode(3)

add_from_file(2)

decode_output(2)

getUniGrams(2)

from_documents(2)

build_corpus(2)

getVocabularyByDocument(2)

getBiGrams(2)

get_id_from_token(2)

add_a_word(2)

add_text(2)

add_many(2)

getFullDict(2)

gen_DAG(1)

from_text_files(1)

from_text(1)

from_serializable(1)

from_sentences(1)

get(1)

add_constant(1)

getPTStopWords(1)

getQuestions(1)

getVocabularySize(1)

get_all_source_words(1)

get_all_translations(1)

get_pos(1)

get_term_text(1)

make_dictionary(1)

seg_content(1)

from_nlp_data(1)

encode_sent(1)

from_idx2word_dict(1)

convert_sentence(1)

add_new_word(1)

add_sentence(1)

add_chunk(1)

add_word_lst(1)

append(1)

build(1)

コード例 #1

ファイルを表示

ファイル: __main__.py プロジェクト: ocktree/CMPT470

#----------------------------------------------------------------------------------------------------------------------
# 2. Data Preprocessing
#----------------------------------------------------------------------------------------------------------------------
print('2. Data Preprocessing....')
logger.info("Data Preprocessing for train dataset startting.....")
logger.info(
    "Creating input vocabulary for context and output vocabulary for lable/method name"
)
input_vocab = Vocabulary("Context")
output_vocab = Vocabulary("label")

contexts = []
labels = []
for index, row in df_train.iterrows():
    input_vocab.addSentence(row['Context'])
    contexts.append(row['Context'])
    output_vocab.addSentence(row['Label'])
    labels.append(row['Label'])
logger.info("Number of word in input vocabulary: %d", input_vocab.n_words)
logger.info("Number of word in output vocabulary: %d", output_vocab.n_words)
logger.info(
    "Removing the words that appear less than %d in input and output vocabulary",
    config.min_frequency)
input_vocab.removeWordLessThan(config.min_frequency)
output_vocab.removeWordLessThan(config.min_frequency)
logger.info("After Filtering")
logger.info("Number of word in input vocabulary: %d", input_vocab.n_words)
logger.info("Number of word in output vocabulary: %d", output_vocab.n_words)

context_vocab_size = input_vocab.n_words