Python Series.reset_indexの例

プログラミング言語: Python

名前空間/パッケージ名: cudf

クラス/型: Series

メソッド/関数: reset_index

hotexamples.comのコード掲載数: 1

Python Series.reset_index - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのcudf.Series.reset_indexの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Series(30)

astype(11)

from_pandas(9)

from_masked_array(6)

unique(5)

to_pandas(5)

to_array(5)

can_cast_safely(4)

applymap(3)

sort_values(3)

isin(3)

sum(2)

map(2)

floor(2)

fillna(2)

to_numpy(2)

dropna(2)

ceil(2)

set_mask(1)

take(1)

sum_of_squares(1)

sort_index(1)

max(1)

reset_index(1)

product(1)

nsmallest(1)

nlargest(1)

nans_to_nulls(1)

min(1)

abs(1)

label_encoding(1)

equals(1)

copy(1)

argsort(1)

value_counts(1)

コード例 #1

ファイルを表示

ファイル: _vectorizers.py プロジェクト: st071300/cuML

    def get_char_ngrams(self, ngram_size, str_series, doc_id_sr):
        """
        Handles ngram generation for characters analyzers.

        When analyzer is 'char_wb', we generate ngrams within word boundaries,
        meaning we need to first tokenize and pad each token with a delimiter.
        """
        if self.analyzer == 'char_wb' and ngram_size != 1:
            token_count = str_series.str.token_count(self.delimiter)
            tokens = str_series.str.tokenize(self.delimiter)
            del str_series

            padding = Series(self.delimiter).repeat(len(tokens))
            tokens = tokens.str.cat(padding)
            padding = padding.reset_index(drop=True)
            tokens = padding.str.cat(tokens)
            tokens = tokens.reset_index(drop=True)

            ngram_sr = tokens.str.character_ngrams(n=ngram_size)

            doc_id_df = cudf.DataFrame({
                'doc_id':
                doc_id_sr.repeat(token_count).reset_index(drop=True),
                # formula to count ngrams given number of letters per token:
                'ngram_count':
                tokens.str.len() - (ngram_size - 1)
            })
            del tokens
            ngram_count = doc_id_df.groupby('doc_id',
                                            sort=True).sum()['ngram_count']
            return ngram_sr, ngram_count, token_count

        if ngram_size == 1:
            token_count = str_series.str.len()
            ngram_sr = str_series.str.character_tokenize()
            del str_series
        elif self.analyzer == 'char':
            token_count = str_series.str.len()
            ngram_sr = str_series.str.character_ngrams(n=ngram_size)
            del str_series

        ngram_count = token_count - (ngram_size - 1)

        return ngram_sr, ngram_count, token_count