Python BPEmb.encode_with_bos_eosの例

プログラミング言語: Python

名前空間/パッケージ名: bpemb

クラス/型: BPEmb

メソッド/関数: encode_with_bos_eos

hotexamples.comのコード掲載数: 2

Python BPEmb.encode_with_bos_eos - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのbpemb.BPEmb.encode_with_bos_eosの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

BPEmb(30)

encode_ids(27)

encode(21)

decode_ids(9)

embed(9)

encode_ids_with_bos_eos(8)

decode(2)

encode_ids_with_eos(2)

encode_with_bos_eos(2)

pad_token_id(2)

available_vocab_sizes(1)

encode_with_eos(1)

most_similar(1)

コード例 #1

ファイルを表示

ファイル: TestBPE.py プロジェクト: erelcan/keras-transformer

def test_encoding():
    text = ["This is Stratford", "<pad>"]

    bpemb_en = BPEmb(lang="en", add_pad_emb=True)

    # We can auto-add and encode start/end tokens. However, encoder can't handle <pad> directly.
    # We should pad outside with the corresponding index (index of the last word when add_pad_emb True).
    print(bpemb_en.encode(text))
    print(bpemb_en.encode_with_eos(text))
    print(bpemb_en.encode_with_bos_eos(text))
    print(bpemb_en.encode_ids(text))
    print(bpemb_en.encode_ids_with_eos(text))
    print(bpemb_en.encode_ids_with_bos_eos(text))

コード例 #2

ファイルを表示

class BPETokenizer:
    """Use byte pair encoding to transform text"""
    def __init__(self, lang='ru', pretrained=True, vocab_size=100000, dim=300):
        self.lang = lang
        self.pretrained = pretrained
        self.bpe = BPEmb(lang=self.lang,
                         vs=vocab_size,
                         dim=dim,
                         vs_fallback=True)

    def fit(self, text):
        raise NotImplementedError('fit is not supported')

    def transform(self, text: Union[str, List[str]], get_ids=True):
        if get_ids:
            return self.bpe.encode_ids_with_bos_eos(text)
        else:
            return self.bpe.encode_with_bos_eos(text)