Python unicode_scriptの例

プログラミング言語: Python

名前空間/パッケージ名: tensorflow.python.ops.string_ops

メソッド/関数: unicode_script

hotexamples.comのコード掲載数: 7

Python unicode_script - 7件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのtensorflow.python.ops.string_ops.unicode_scriptの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

  def _should_split(self, script_tokenized):
    token_script_ids = string_ops.unicode_script(
        ragged_string_ops.unicode_decode(script_tokenized.flat_values,
                                         "UTF-8"))[:, :1]

    token_script_ids_flat = token_script_ids.flat_values
    is_cjk = self._is_cjk(token_script_ids_flat)
    is_emoji = wordshape_ops.wordshape(script_tokenized.flat_values,
                                       wordshape_ops.WordShape.HAS_EMOJI)
    is_punct = wordshape_ops.wordshape(
        script_tokenized.flat_values,
        wordshape_ops.WordShape.IS_PUNCT_OR_SYMBOL)
    split_cond = is_cjk | is_emoji | is_punct
    return split_cond

コード例 #2

ファイルを表示

 def testValidScripts(self):
     inputs = [
         ord("a"),
         0x0411,  # CYRILLIC CAPITAL LETTER BE
         0x82b8,  # CJK UNIFIED IDEOGRAPH-82B8
         ord(",")
     ]
     with self.cached_session():
         input_vector = constant_op.constant(inputs, dtypes.int32)
         outputs = string_ops.unicode_script(input_vector).eval()
         self.assertAllEqual(
             outputs,
             [
                 25,  # USCRIPT_LATIN (LATN)
                 8,  # USCRIPT_CYRILLIC (CYRL)
                 17,  # USCRIPT_HAN (HANI)
                 0  # USCRIPT_COMMON (ZYYY)
             ])

コード例 #3

ファイルを表示

ファイル: unicode_script_op_test.py プロジェクト: adit-chandra/tensorflow

 def testValidScripts(self):
   inputs = [
       ord("a"),
       0x0411,  # CYRILLIC CAPITAL LETTER BE
       0x82b8,  # CJK UNIFIED IDEOGRAPH-82B8
       ord(",")
   ]
   with self.cached_session():
     input_vector = constant_op.constant(inputs, dtypes.int32)
     outputs = string_ops.unicode_script(input_vector).eval()
     self.assertAllEqual(
         outputs,
         [
             25,  # USCRIPT_LATIN (LATN)
             8,  # USCRIPT_CYRILLIC (CYRL)
             17,  # USCRIPT_HAN (HANI)
             0  # USCRIPT_COMMON (ZYYY)
         ])

コード例 #4

ファイルを表示

 def benchmark_unicode_script(self):
     with session.Session(config=benchmark.benchmark_config()) as sess:
         chars = self._generateBenchmarkInput(1000000)
         script = string_ops.unicode_script(chars)
         self.run_op_benchmark(sess, script.op, min_iters=100)

コード例 #5

ファイルを表示

 def testInvalidScript(self):
     inputs = [-100, 0xffffff]
     with self.cached_session():
         input_vector = constant_op.constant(inputs, dtypes.int32)
         outputs = string_ops.unicode_script(input_vector).eval()
         self.assertAllEqual(outputs, [-1, -1])

コード例 #6

ファイルを表示

ファイル: unicode_script_op_test.py プロジェクト: adit-chandra/tensorflow

 def benchmark_unicode_script(self):
   with session.Session(config=benchmark.benchmark_config()) as sess:
     chars = self._generateBenchmarkInput(1000000)
     script = string_ops.unicode_script(chars)
     self.run_op_benchmark(sess, script.op, min_iters=100)

コード例 #7

ファイルを表示

ファイル: unicode_script_op_test.py プロジェクト: adit-chandra/tensorflow

 def testInvalidScript(self):
   inputs = [-100, 0xffffff]
   with self.cached_session():
     input_vector = constant_op.constant(inputs, dtypes.int32)
     outputs = string_ops.unicode_script(input_vector).eval()
     self.assertAllEqual(outputs, [-1, -1])