Python get_pretrained_embedding_layerの例

プログラミング言語: Python

名前空間/パッケージ名: allennlp.modules.token_embedders.embedding

メソッド/関数: get_pretrained_embedding_layer

hotexamples.comのコード掲載数: 5

Python get_pretrained_embedding_layer - 5件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのallennlp.modules.token_embedders.embedding.get_pretrained_embedding_layerの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: embedding_test.py プロジェクト: Taekyoon/allennlp

 def test_get_embedding_layer_crashes_when_embedding_file_has_header(self):
     vocab = Vocabulary()
     embeddings_filename = self.TEST_DIR + "embeddings.gz"
     with gzip.open(embeddings_filename, 'wb') as embeddings_file:
         embeddings_file.write("dimensionality 3\n".encode('utf-8'))
         embeddings_file.write("word1 1.0 2.3 -1.0\n".encode('utf-8'))
         embeddings_file.write("word2 0.1 0.4 -4.0\n".encode('utf-8'))
     with pytest.raises(Exception):
         get_pretrained_embedding_layer(embeddings_filename, vocab)

コード例 #2

ファイルを表示

ファイル: embedding_test.py プロジェクト: panyang/allennlp

    def test_get_embedding_layer_uses_correct_embedding_dim(self):
        vocab = Vocabulary()
        embeddings_filename = self.TEST_DIR + "embeddings.gz"
        with gzip.open(embeddings_filename, 'wb') as embeddings_file:
            embeddings_file.write("word1 1.0 2.3 -1.0\n".encode('utf-8'))
            embeddings_file.write("word2 0.1 0.4 -4.0\n".encode('utf-8'))
        embedding_layer = get_pretrained_embedding_layer(
            embeddings_filename, vocab)
        assert embedding_layer.embedding_dim == 3

        with gzip.open(embeddings_filename, 'wb') as embeddings_file:
            embeddings_file.write("word1 1.0 2.3 -1.0 3.1\n".encode('utf-8'))
            embeddings_file.write("word2 0.1 0.4 -4.0 -1.2\n".encode('utf-8'))
        embedding_layer = get_pretrained_embedding_layer(
            embeddings_filename, vocab)
        assert embedding_layer.embedding_dim == 4

コード例 #3

ファイルを表示

ファイル: embedding_test.py プロジェクト: Taekyoon/allennlp

 def test_get_embedding_layer_initializes_unseen_words_randomly_not_zero(
         self):
     vocab = Vocabulary()
     vocab.add_token_to_namespace("word2")
     embeddings_filename = self.TEST_DIR + "embeddings.gz"
     with gzip.open(embeddings_filename, 'wb') as embeddings_file:
         embeddings_file.write("word 1.0 2.3 -1.0\n".encode('utf-8'))
     embedding_layer = get_pretrained_embedding_layer(
         embeddings_filename, vocab)
     word_vector = embedding_layer.weight.data[vocab.get_token_index(
         "word2")]
     assert not numpy.allclose(word_vector.numpy(),
                               numpy.array([0.0, 0.0, 0.0]))

コード例 #4

ファイルを表示

ファイル: embedding_test.py プロジェクト: Taekyoon/allennlp

 def test_get_embedding_layer_skips_inconsistent_lines(self):
     vocab = Vocabulary()
     vocab.add_token_to_namespace("word1")
     vocab.add_token_to_namespace("word2")
     embeddings_filename = self.TEST_DIR + "embeddings.gz"
     with gzip.open(embeddings_filename, 'wb') as embeddings_file:
         embeddings_file.write("word1 1.0 2.3 -1.0\n".encode('utf-8'))
         embeddings_file.write("word2 0.1 0.4 \n".encode('utf-8'))
     embedding_layer = get_pretrained_embedding_layer(
         embeddings_filename, vocab)
     word_vector = embedding_layer.weight.data[vocab.get_token_index(
         "word2")]
     assert not numpy.allclose(word_vector.numpy()[:2],
                               numpy.array([0.1, 0.4]))

コード例 #5

ファイルを表示

ファイル: embedding_test.py プロジェクト: Taekyoon/allennlp

    def test_forward_works_with_projection_layer(self):
        vocab = Vocabulary()
        vocab.add_token_to_namespace('the')
        vocab.add_token_to_namespace('a')
        embedding_layer = get_pretrained_embedding_layer(
            'tests/fixtures/glove.6B.300d.sample.txt.gz',
            vocab,
            projection_dim=20)
        input_tensor = Variable(torch.LongTensor([[3, 2, 1, 0]]))
        embedded = embedding_layer(input_tensor).data.numpy()
        assert embedded.shape == (1, 4, 20)

        input_tensor = Variable(torch.LongTensor([[[3, 2, 1, 0]]]))
        embedded = embedding_layer(input_tensor).data.numpy()
        assert embedded.shape == (1, 1, 4, 20)