Python Feature.is_splitter_candidateの例

プログラミング言語: Python

名前空間/パッケージ名: feature.feature

クラス/型: Feature

メソッド/関数: is_splitter_candidate

hotexamples.comのコード掲載数: 2

Python Feature.is_splitter_candidate - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfeature.feature.Feature.is_splitter_candidateの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Feature(10)

get_pos_target(3)

is_spliter_candidate(3)

get_pos_source(3)

get_stem_source(2)

get_class(2)

get_distance(2)

is_splitter_candidate(2)

get_stem_target(2)

get_aspect_source(1)

gen_feature_vector(1)

init_idf(1)

get_tense_target(1)

get_tense_source(1)

get_tense(1)

get_similarity_of_words(1)

get_aspect_target(1)

get_aspect(1)

gen_feature_matrix(1)

get_polarity(1)

get_modality(1)

get_feature_name(1)

get_distance_diff(1)

load_feature(1)

コード例 #1

ファイルを表示

 def split_paragraph(self, par):
     sens = []
     try:
         new_par = self.regex_rule.fn_normalize_special_mark(par)
         paragraph, number, url, url2, email, datetime, hard_rules, non_vnese, mark, mark3, mark4 = \
             self.regex_rule.run_regex_predict(new_par)
         features, _ = self.make_feature(paragraph)
         if not features:
             sens.append(par)
             return sens
         labels = self.classifier.predict(features)
         idx = 0
         pos_start = 0
         pos_end = 0
         for c in paragraph:
             if Feature.is_splitter_candidate(c):
                 if idx < len(labels) and labels[idx] == 1:
                     sens.append(paragraph[pos_start:pos_end + 1].strip())
                     pos_start = pos_end + 1
                 idx += 1
             pos_end += 1
         if pos_start < len(paragraph):
             sens.append(paragraph[pos_start:].strip())
         paragraph = '\n'.join(sens)
         paragraph = self.regex_rule.restore_info(paragraph, number, url, url2, email, datetime, hard_rules, non_vnese, mark, \
                                            mark3, mark4)
         # paragraph = self.regex_rule.normalize_special_mark.sub(u' \g<special_mark> ', paragraph)
         # paragraph = self.regex_rule.normalize_space.sub(u' ', paragraph)
         sens = paragraph.split('\n')
         return sens
     except Exception as e:
         print(traceback.format_exc())
         sens.append(par)
         return sens

コード例 #2

ファイルを表示

ファイル: sentence_spliter.py プロジェクト: nguyentuc/chatbot_v4_21-10

 def split_paragraph(self, par):
     sens = []
     try:
         paragraph, number, url, url2, email, datetime, hard_rules, non_vnese, mark, mark3, mark4 = \
             self.regex_rule.run_regex_predict(par)
         features, _ = self.make_feature(paragraph)
         if not features:
             sens.append(par)
             return sens
         labels = self.classifier.predict(features)
         idx = 0
         pos_start = 0
         pos_end = 0
         for c in paragraph:
             if Feature.is_splitter_candidate(c):
                 if idx < len(labels) and labels[idx] == 1:
                     sens.append(paragraph[pos_start:pos_end + 1].strip())
                     pos_start = pos_end + 1
                 idx += 1
             pos_end += 1
         if pos_start < len(paragraph):
             sens.append(paragraph[pos_start:].strip())
         paragraph = '\n'.join(sens)
         paragraph = self.regex_rule.restore_info(paragraph, number, url, url2, email, datetime, hard_rules, non_vnese, mark, \
                                            mark3, mark4)
         sens = paragraph.split('\n')
         return sens
     except:
         sens.append(par)
         return sens