Exemplos de dataframe.drop_duplicates em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: dask

Classe / Tipo: dataframe

Método / Função: drop_duplicates

Exemplos em hotexamples.com: 2

dataframe.drop_duplicates em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de dask.dataframe.drop_duplicates em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

groupby(7)

select_dtypes(4)

compute(3)

set_index(3)

dropna(3)

reset_index(3)

map_partitions(3)

append(2)

isnull(2)

drop(2)

drop_duplicates(2)

join(1)

get_partition(1)

reindex(1)

fillna(1)

sample(1)

to_delayed(1)

Métodos Frequentes

groupby (7)

select_dtypes (4)

compute (3)

set_index (3)

dropna (3)

reset_index (3)

map_partitions (3)

append (2)

isnull (2)

drop (2)

Métodos Frequentes

drop_duplicates (2)

join (1)

get_partition (1)

reindex (1)

fillna (1)

sample (1)

to_delayed (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: transformations.py Projeto: dansilva11/candlestick-data-pipeline

def drop_duplicate_rows(data: dd = None, subset: List[str] = None, keep: str = None) -> dd: """ Drop rows containing duplicate data for the specified subset of columns :param data: dask dataframe :param subset: list of column names :param keep: which duplicate to keep :return: modified dask dataframe """ return data.drop_duplicates(subset=subset, keep=keep)

Exemplo n.º 2

0

Exibir arquivo

def transform(self, X: dd, y=None): """ Remove duplicated rows Args: X (dd): Dataframe to be processed y (dd, optional): Target. Defaults to None. Returns: (dd): Dataframe with rows removed """ return X.drop_duplicates(subset=self.subset)