Python SentencePieceText Examples

Programming Language: Python

Namespace/Package Name: sentencepiece_pb2

Method/Function: SentencePieceText

Examples at hotexamples.com: 2

Python SentencePieceText - 2 examples found. These are the top rated real world Python examples of sentencepiece_pb2.SentencePieceText extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

 def __init__(self, vocab_file):
     #self.vocab = vocab_file
     self.sp = spm.SentencePieceProcessor()
     self.sp.load(vocab_file)
     self.spt = sentencepiece_pb2.SentencePieceText()
     self.huggingface = XLMRobertaTokenizer.from_pretrained(vocab_file)
     self.vocab = self.huggingface.get_vocab()

Example #2

Show file

 def encode(self, sentence):
     spt = sentencepiece_pb2.SentencePieceText()
     spt.ParseFromString(self.sp.encode_as_serialized_proto(sentence))
     offsets = []
     tokens = []
     for piece in spt.pieces:
         tokens.append(piece.id)
         offsets.append((piece.begin, piece.end))
     return tokens, offsets