Python TokenEncoder.inverse_transform示例

编程语言: Python

命名空间/包名称: spaghetto.utils

类/类型: TokenEncoder

方法/功能: inverse_transform

hotexamples.com的示例: 8

Python TokenEncoder.inverse_transform - 已找到8个示例。这些是从开源项目中提取的最受好评的spaghetto.utils.TokenEncoder.inverse_transform现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

TokenEncoder(11)

transform(6)

inverse_transform(4)

fit_transform(1)

示例#1

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_tokenizer_with_special_tokens(self, special_tokens, expected):
        tokenizer = TokenEncoder(special_tokens=special_tokens)
        indices = tokenizer.fit_transform(['abcdefg'])[0]
        result = [tokenizer.id2token_[idx] for idx in indices]
        assert result == expected

        joined = tokenizer.inverse_transform([indices])[0]
        assert joined == 'abcdefg'

示例#2

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_tokenizer_with_special_tokens(self, special_tokens, expected):
        tokenizer = TokenEncoder(special_tokens=special_tokens)
        indices = tokenizer.fit_transform(['abcdefg'])[0]
        result = [tokenizer.id2token_[idx] for idx in indices]
        assert result == expected

        joined = tokenizer.inverse_transform([indices])[0]
        assert joined == 'abcdefg'

示例#3

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_tokenizer_encoded_and_decodes_simple_text(self):
        X = 'abcdef'
        tokenizer = TokenEncoder().fit(X)

        encoded = tokenizer.transform(['fedcba'])[0]
        assert len(encoded) == 6
        assert all([type(idx) == int for idx in encoded])

        decoded = tokenizer.inverse_transform([encoded])[0]
        assert decoded == 'fedcba'

示例#4

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_tokenizer_encoded_and_decodes_simple_text(self):
        X = 'abcdef'
        tokenizer = TokenEncoder().fit(X)

        encoded = tokenizer.transform(['fedcba'])[0]
        assert len(encoded) == 6
        assert all([type(idx) == int for idx in encoded])

        decoded = tokenizer.inverse_transform([encoded])[0]
        assert decoded == 'fedcba'

示例#5

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_tokenizer_with_special_special_token(self, line):
        tokenizer = TokenEncoder(special_tokens=['$']).fit(['hi'])

        encoded = tokenizer.transform([line])
        decoded = tokenizer.inverse_transform(encoded)[0]
        assert decoded == line

示例#6

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_detokenize_with_space(self, line):
        tokenizer = TokenEncoder(separator=" ").fit([line])
        encoded = tokenizer.transform([line])
        decoded = tokenizer.inverse_transform(encoded)[0]

        assert decoded == line

示例#7

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_tokenizer_with_special_special_token(self, line):
        tokenizer = TokenEncoder(special_tokens=['$']).fit(['hi'])

        encoded = tokenizer.transform([line])
        decoded = tokenizer.inverse_transform(encoded)[0]
        assert decoded == line

示例#8

0

显示文件

文件： test_utils.py 项目： BenjaminBossan/spaghetto

    def test_detokenize_with_space(self, line):
        tokenizer = TokenEncoder(separator=" ").fit([line])
        encoded = tokenizer.transform([line])
        decoded = tokenizer.inverse_transform(encoded)[0]

        assert decoded == line