Python TokenCharactersIndexer.as_padded_tensor 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: allennlp.data.token_indexers

메소드/함수: as_padded_tensor

hotexamples.com에서의 예제들: 2

Python TokenCharactersIndexer.as_padded_tensor - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 allennlp.data.token_indexers.TokenCharactersIndexer.as_padded_tensor에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

TokenCharactersIndexer(30)

tokens_to_indices(4)

as_padded_tensor(2)

as_padded_tensor_dict(2)

get_padding_lengths(2)

pad_token_sequence(2)

count_vocab_items(1)

from_params(1)

token_to_indices(1)

예제 #1

파일 보기

파일: character_token_indexer_test.py 프로젝트: wgc20/GrailQA

    def test_min_padding_length(self):
        sentence = "AllenNLP is awesome ."
        tokens = [Token(token) for token in sentence.split(" ")]
        vocab = Vocabulary()
        vocab.add_token_to_namespace("A", namespace="characters")  # 2
        vocab.add_token_to_namespace("l", namespace="characters")  # 3
        vocab.add_token_to_namespace("e", namespace="characters")  # 4
        vocab.add_token_to_namespace("n", namespace="characters")  # 5
        vocab.add_token_to_namespace("N", namespace="characters")  # 6
        vocab.add_token_to_namespace("L", namespace="characters")  # 7
        vocab.add_token_to_namespace("P", namespace="characters")  # 8
        vocab.add_token_to_namespace("i", namespace="characters")  # 9
        vocab.add_token_to_namespace("s", namespace="characters")  # 10
        vocab.add_token_to_namespace("a", namespace="characters")  # 11
        vocab.add_token_to_namespace("w", namespace="characters")  # 12
        vocab.add_token_to_namespace("o", namespace="characters")  # 13
        vocab.add_token_to_namespace("m", namespace="characters")  # 14
        vocab.add_token_to_namespace(".", namespace="characters")  # 15

        indexer = TokenCharactersIndexer("characters", min_padding_length=10)
        indices = indexer.tokens_to_indices(tokens, vocab, "char")
        key_padding_lengths = "num_token_characters"
        value_padding_lengths = 0
        for token in indices["char"]:
            item = indexer.get_padding_lengths(token)
            value = item.values()
            value_padding_lengths = max(value_padding_lengths, max(value))
        padded = indexer.as_padded_tensor(
            indices, {"char": len(indices["char"])},
            {key_padding_lengths: value_padding_lengths})
        assert padded["char"].tolist() == [[2, 3, 3, 4, 5, 6, 7, 8, 0, 0],
                                           [9, 10, 0, 0, 0, 0, 0, 0, 0, 0],
                                           [11, 12, 4, 10, 13, 14, 4, 0, 0, 0],
                                           [15, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

예제 #2

파일 보기

파일: character_token_indexer_test.py 프로젝트: wgc20/GrailQA

 def test_as_array_produces_token_sequence(self):
     indexer = TokenCharactersIndexer("characters", min_padding_length=1)
     padded_tokens = indexer.as_padded_tensor(
         {'k': [[1, 2, 3, 4, 5], [1, 2, 3], [1]]},
         desired_num_tokens={'k': 4},
         padding_lengths={"num_token_characters": 10})
     assert padded_tokens["k"].tolist() == [[1, 2, 3, 4, 5, 0, 0, 0, 0, 0],
                                            [1, 2, 3, 0, 0, 0, 0, 0, 0, 0],
                                            [1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                                            [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]