Python Vocabulary.add_textの例

プログラミング言語: Python

名前空間/パッケージ名: vocabulary

クラス/型: Vocabulary

メソッド/関数: add_text

hotexamples.comのコード掲載数: 2

Python Vocabulary.add_text - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのvocabulary.Vocabulary.add_textの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Vocabulary(30)

add_word(15)

clean_text(8)

build_vocab(8)

add_words(8)

deserialize(7)

compile(4)

add(4)

antonym(4)

auto_punctuate(3)

add_token(3)

encode(3)

add_from_file(2)

decode_output(2)

getUniGrams(2)

from_documents(2)

build_corpus(2)

getVocabularyByDocument(2)

getBiGrams(2)

get_id_from_token(2)

add_a_word(2)

add_text(2)

add_many(2)

getFullDict(2)

gen_DAG(1)

from_text_files(1)

from_text(1)

from_serializable(1)

from_sentences(1)

get(1)

add_constant(1)

getPTStopWords(1)

getQuestions(1)

getVocabularySize(1)

get_all_source_words(1)

get_all_translations(1)

get_pos(1)

get_term_text(1)

make_dictionary(1)

seg_content(1)

from_nlp_data(1)

encode_sent(1)

from_idx2word_dict(1)

convert_sentence(1)

add_new_word(1)

add_sentence(1)

add_chunk(1)

add_word_lst(1)

append(1)

build(1)

コード例 #1

ファイルを表示

class RickAndMortyData(Dataset):
    def __init__(self, text, seq_length, vocab=None):
        self.text = text
        self.seq_length = seq_length
        if vocab is None:
            self.vocab = Vocabulary()
            self.vocab.add_text(self.text)
        else:
            self.vocab = vocab
        self.text = self.vocab.clean_text(text)
        self.tokens = self.vocab.tokenize(self.text)

    def __len__(self):
        return len(self.tokens) - self.seq_length

    def __getitem__(self, idx):
        x = [
            self.vocab[word] for word in self.tokens[idx:idx + self.seq_length]
        ]
        y = [self.vocab[self.tokens[idx + self.seq_length]]]
        x = torch.LongTensor(x)
        y = torch.LongTensor(y)
        return x, y

コード例 #2

ファイルを表示

batch_size = 128
lstm_size = 128
seq_length = 64
num_layers = 2
bidirectional = True
embeddings_size = 300
dropout = 0.5
learning_rate = 0.001

with open(data_path, 'r') as f:
    text = f.read()

vocab = Vocabulary()

if args.vocab_path is None:
    vocab.add_text(text)
    vocab.save('data/vocab.pkl')
else:
    vocab.load(args.load_vocab)

print(vocab)

model = MortyFire(vocab_size=len(vocab),
                  lstm_size=lstm_size,
                  embed_size=embeddings_size,
                  seq_length=seq_length,
                  num_layers=num_layers,
                  dropout=dropout,
                  bidirectional=bidirectional,
                  train_on_gpu=train_on_gpu)