Python clean_english_str_tf 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: delta.data.preprocess.text_ops

메소드/함수: clean_english_str_tf

hotexamples.com에서의 예제들: 3

Python clean_english_str_tf - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 delta.data.preprocess.text_ops.clean_english_str_tf에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: text_ops_test.py 프로젝트: lizhanyang505/delta-1

 def test_clean_english_str_tf(self):
   t_sentence_in = tf.placeholder(dtype=tf.string)
   t_sentence_out = clean_english_str_tf(t_sentence_in)
   with self.cached_session(use_gpu=False, force_gpu=False) as sess:
     sentence_out = sess.run(t_sentence_out,
                             {t_sentence_in: "I'd like to have an APPLE! "})
     logging.info(sentence_out)
     self.assertEqual("i 'd like to have an apple !",
                      sentence_out.decode("utf-8"))
     sentence_out = sess.run(t_sentence_out,
                             {t_sentence_in: ["I'd like to have an APPLE! "]})
     logging.info(sentence_out)
     self.assertEqual("i 'd like to have an apple !",
                      sentence_out[0].decode("utf-8"))

예제 #2

파일 보기

파일: base_text_task.py 프로젝트: luffywalf/delta

  def pre_process_pipeline(self, input_sentences):
    """Data pipeline function for pre-processing."""
    language = self.task_config["language"]
    clean_english = self.task_config.get("clean_english", False)
    split_by_space = self.task_config.get("split_by_space", False)
    use_word = self.task_config.get("use_word", False)

    if language == "english":
      if clean_english:
        batch = clean_english_str_tf(input_sentences)
      else:
        batch = input_sentences
    else:
      if split_by_space:
        batch = input_sentences
      else:
        if use_word:
          batch = chinese_word_cut_tf(input_sentences)
        else:
          batch = char_cut_tf(input_sentences)
    return batch

예제 #3

파일 보기

파일: base_text_task.py 프로젝트: zr940326/delta

    def pre_process_pipeline(self, input_sentences):
        """Data pipeline function for pre-processing."""
        language = self.task_config["language"]
        clean_english = self.task_config.get("clean_english", False)
        split_by_space = self.task_config.get("split_by_space", False)
        use_word = self.task_config.get("use_word", False)

        if language == "english":
            if clean_english:
                batch = clean_english_str_tf(input_sentences)
            else:
                batch = input_sentences
        else:
            if split_by_space:
                batch = input_sentences
            else:
                if use_word:
                    main_root = os.environ["MAIN_ROOT"]
                    dict_path = os.path.join(
                        main_root, "tools/cppjieba/dict/jieba.dict.utf8")
                    hmm_path = os.path.join(
                        main_root, "tools/cppjieba/dict/hmm_model.utf8")
                    user_dict_path = os.path.join(
                        main_root, "tools/cppjieba/dict/user.dict.utf8")
                    idf_path = os.path.join(main_root,
                                            "tools/cppjieba/dict/idf.utf8")
                    stop_word_path = os.path.join(
                        main_root, "tools/cppjieba/dict/stop_words.utf8")
                    batch = py_x_ops.jieba_cut(input_sentences,
                                               hmm=True,
                                               dict_path=dict_path,
                                               hmm_path=hmm_path,
                                               user_dict_path=user_dict_path,
                                               idf_path=idf_path,
                                               stop_word_path=stop_word_path)
                else:
                    batch = char_cut_tf(input_sentences)
        return batch