Python _split_token_to_subtokens Examples

Programming Language: Python

Namespace/Package Name: official.transformer.utils.tokenizer

Method/Function: _split_token_to_subtokens

Examples at hotexamples.com: 2

Python _split_token_to_subtokens - 2 examples found. These are the top rated real world Python examples of official.transformer.utils.tokenizer._split_token_to_subtokens extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

  def test_split_token_to_subtokens(self):
    token = "abc"
    subtoken_dict = {"a": 0, "b": 1, "c": 2, "ab": 3}
    max_subtoken_length = 2

    subtokens = tokenizer._split_token_to_subtokens(
        token, subtoken_dict, max_subtoken_length)
    self.assertEqual(["ab", "c"], subtokens)

Example #2

Show file

File: tokenizer_test.py Project: 812864539/models

  def test_split_token_to_subtokens(self):
    token = "abc"
    subtoken_dict = {"a": 0, "b": 1, "c": 2, "ab": 3}
    max_subtoken_length = 2

    subtokens = tokenizer._split_token_to_subtokens(
        token, subtoken_dict, max_subtoken_length)
    self.assertEqual(["ab", "c"], subtokens)