Esempi in Python per WhitespaceTokenizer

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: tensorflow_text.python.ops

Metodo/funzione: WhitespaceTokenizer

Esempi su hotexamples.com: 5

WhitespaceTokenizer in Python: 5 esempi trovati. Questi sono i migliori esempi reali in Python per tensorflow_text.python.ops.WhitespaceTokenizer, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Esempio n. 1

Mostra file

File: benchmark_utils.py Progetto: linscomt/text

    def _convert_to_ragged_inputs(self, inputs):
        """Transforms the text batch inputs to a ragged shape."""
        if isinstance(self.input_data, ragged_tensor.RaggedTensor):
            return inputs

        inputs = text_ops.WhitespaceTokenizer().tokenize(inputs)
        return inputs

Esempio n. 2

Mostra file

File: ops_benchmarks.py Progetto: hashim361/text

  def benchmark_pad_along_dimension(self):
    self.input_data = text_ops.WhitespaceTokenizer().tokenize(self.input_data)

    self._run(text_ops.pad_along_dimension, {
        "axis": -1,
        "right_pad": ["RP"],
        "left_pad": ["LP"]
    })

Esempio n. 3

Mostra file

File: tokenizers_benchmarks.py Progetto: isabella232/text-1

    def benchmark_wordpiece_tokenizer(self):
        self.input_data = text_ops.WhitespaceTokenizer().tokenize(
            self.input_data)

        tokenizer = text_ops.WordpieceTokenizer(
            vocab_lookup_table=self._create_table((_BERT_VOCAB_PATH)),
            unknown_token=None,
            token_out_type=dtypes.int64)
        self._run(tokenizer)

Esempio n. 4

Mostra file

File: ops_benchmarks.py Progetto: hashim361/text

  def benchmark_ngrams(self):
    self.input_data = text_ops.WhitespaceTokenizer().tokenize(self.input_data)

    self._run(
        text_ops.ngrams, {
            "width": 2,
            "axis": -1,
            "reduction_type": text_ops.Reduction.STRING_JOIN,
            "string_separator": "|"
        })

Esempio n. 5

Mostra file

    def benchmark_sliding_window(self):
        self.input_data = text_ops.WhitespaceTokenizer().tokenize(
            self.input_data)

        self._run(text_ops.sliding_window, {"width": 3, "axis": -1})