Python ngramsの例

プログラミング言語: Python

名前空間/パッケージ名: magellan.cython.test_functions

メソッド/関数: ngrams

hotexamples.comのコード掲載数: 4

Python ngrams - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのmagellan.cython.test_functions.ngramsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: overlap_blocker.py プロジェクト: epaulson/enrique

    def process_table(self, df, overlap_attr, qgram, rem_stop_words):
        # get ltable attr column
        attr_col_values = df[overlap_attr].values
        # remove non-ascii chars
        attr_col_values = [remove_non_ascii(v) for v in attr_col_values]

        # remove special characters
        attr_col_values = [
            self.rem_punctuations(v).lower() for v in attr_col_values
        ]
        # chop the attribute values
        col_values_chopped = [v.split() for v in attr_col_values]
        # convert it into set

        col_values_chopped = [list(set(v)) for v in col_values_chopped]

        # remove stop words
        if rem_stop_words == True:
            col_values_chopped = [
                self.rem_stopwords(v) for v in col_values_chopped
            ]
        if qgram is not None:
            values = [' '.join(v) for v in col_values_chopped]
            col_values_chopped = [ngrams(v, qgram) for v in values]

        return col_values_chopped

コード例 #2

ファイルを表示

ファイル: overlap_blocker.py プロジェクト: Yashg19/enrique

 def process_val(self, val, overlap_attr, qgram, rem_stop_words):
     val = remove_non_ascii(val)
     val = self.rem_punctuations(val).lower()
     chopped_vals = val.split()
     if rem_stop_words == True:
         chopped_vals = self.rem_stopwords(chopped_vals)
     if qgram != None:
         values = ' '.join(chopped_vals)
         chopped_vals = ngrams(values, qgram)
     return list(set(chopped_vals))

コード例 #3

ファイルを表示

ファイル: overlap_blocker.py プロジェクト: epaulson/enrique

 def process_val(self, val, overlap_attr, qgram, rem_stop_words):
     val = remove_non_ascii(val)
     val = self.rem_punctuations(val).lower()
     chopped_vals = val.split()
     if rem_stop_words == True:
         chopped_vals = self.rem_stopwords(chopped_vals)
     if qgram != None:
         values = ' '.join(chopped_vals)
         chopped_vals = ngrams(values, qgram)
     return list(set(chopped_vals))

コード例 #4

ファイルを表示

ファイル: overlap_blocker.py プロジェクト: Yashg19/enrique

    def process_table(self, df, overlap_attr, qgram, rem_stop_words):
        # get ltable attr column
        attr_col_values = df[overlap_attr].values
        # remove non-ascii chars
        attr_col_values = [remove_non_ascii(v) for v in attr_col_values]

        # remove special characters
        attr_col_values = [self.rem_punctuations(v).lower() for v in attr_col_values]
        # chop the attribute values
        col_values_chopped = [v.split() for v in attr_col_values]
        # convert it into set

        col_values_chopped = [list(set(v)) for v in col_values_chopped]

        # remove stop words
        if rem_stop_words == True:
            col_values_chopped = [self.rem_stopwords(v) for v in col_values_chopped]
        if qgram is not None:
            values = [' '.join(v) for v in col_values_chopped]
            col_values_chopped = [ngrams(v, qgram) for v in values]

        return col_values_chopped