Python Vocab.get_idx2token_mappingの例

プログラミング言語: Python

名前空間/パッケージ名: sciwing.vocab.vocab

クラス/型: Vocab

メソッド/関数: get_idx2token_mapping

hotexamples.comのコード掲載数: 2

Python Vocab.get_idx2token_mapping - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsciwing.vocab.vocab.Vocab.get_idx2token_mappingの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Vocab(30)

build_vocab(27)

map_tokens_to_freq_idx(5)

get_token_from_idx(3)

print_stats(3)

get_vocab_len(3)

load_embedding(2)

get_topn_frequent_words(2)

save_to_file(2)

get_idx_from_token(2)

get_idx2token_mapping(2)

get_disp_sentence_from_indices(2)

add_tokens(2)

_add_token(1)

clip_on_mincount(1)

load_from_file(1)

clip_on_max_num(1)

get_orig_vocab_len(1)

コード例 #1

ファイルを表示

 def test_idx2token_out_of_bounds(self, instances):
     single_instance = instances["single_instance"]
     MAX_NUM_WORDS = 100
     vocab_builder = Vocab(instances=single_instance, max_num_tokens=MAX_NUM_WORDS)
     vocab_builder.build_vocab()
     print(vocab_builder.get_idx2token_mapping())
     with pytest.raises(ValueError):
         vocab_builder.get_token_from_idx(100)

コード例 #2

ファイルを表示

    def get_embeddings_for_vocab(self, vocab: Vocab) -> torch.FloatTensor:
        idx2item = vocab.get_idx2token_mapping()
        len_vocab = len(idx2item)
        embeddings = []
        for idx in range(len_vocab):
            item = idx2item.get(idx)
            try:
                # try getting the embeddings from the embeddings dictionary
                emb = self._embeddings[item]
            except KeyError:
                try:
                    # try lowercasing the item and getting the embedding
                    emb = self._embeddings[item.lower()]
                except KeyError:
                    # nothing is working, lets fill it with random integers from normal dist
                    emb = np.random.randn(self.embedding_dimension)
            embeddings.append(emb)

        embeddings = torch.tensor(embeddings, dtype=torch.float)
        return embeddings