Exemplos de ParquetFile.read_row_group em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: fastparquet

Classe / Tipo: ParquetFile

Método / Função: read_row_group

Exemplos em hotexamples.com: 2

ParquetFile.read_row_group em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de fastparquet.ParquetFile.read_row_group em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

ParquetFile(30)

to_pandas(30)

cats(13)

file_scheme(13)

count(7)

_dtypes(5)

fn(5)

iter_row_groups(4)

read_row_group_file(4)

_set_attrs(3)

groupby(3)

head(2)

open(2)

read_row_group(2)

sort_values(2)

columns(1)

Métodos Frequentes

ParquetFile (30)

to_pandas (30)

cats (13)

file_scheme (13)

count (7)

_dtypes (5)

fn (5)

iter_row_groups (4)

read_row_group_file (4)

_set_attrs (3)

Métodos Frequentes

groupby (3)

head (2)

open (2)

read_row_group (2)

sort_values (2)

columns (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: readers.py Projeto: xaviermathew/Xpark

def _read_parquet(fname, start, end, cols=None): pf = ParquetFile(fname) if cols is None: cols = pf.columns i = 0 df_set = [] for rg in pf.row_groups: last_idx_in_rg = i + rg.num_rows - 1 if start <= last_idx_in_rg: f = pf.open(pf.fn) df = pf.read_row_group(rg, cols, pf.categories, infile=f) filters = [] if start > i: filters.append(df.index >= (start - i)) if end is not None and end < last_idx_in_rg: filters.append(df.index < (end - i)) if filters: _LOG.warning('unaligned chunk fname:[%s] start:[%s] end:[%s]', fname, start, end) df = df[functools.reduce(operator.and_, filters)] df_set.append(df) i += rg.num_rows if end is not None and i >= end: break return df_set

Exemplo n.º 2

0

Exibir arquivo

def chunk(self): pf = ParquetFile(self.path) rg = pf.row_groups[0] df = pf.read_row_group(rg, pf.columns, categories=pf.categories, infile=pf.open(pf.fn)) return df