Exemplos de ODPSReader.get_records em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: elasticdl.python.data.odps_io

Classe / Tipo: ODPSReader

Método / Função: get_records

Exemplos em hotexamples.com: 2

ODPSReader.get_records em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de elasticdl.python.data.odps_io.ODPSReader.get_records em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

ODPSReader(6)

get_records(2)

get_shards_count(2)

reset(2)

stop(2)

to_iterator(2)

Métodos Frequentes

ODPSReader (6)

get_records (2)

get_shards_count (2)

reset (2)

stop (2)

to_iterator (2)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: odps_reader.py Projeto: xinan-jiang/elasticdl

def parallel_record_records(self, task, num_processes, shard_size, transform_fn): check_required_kwargs(["project", "access_id", "access_key"], self._kwargs) start = task.start end = task.end table = self._get_odps_table_name(task.shard_name) table = table.split(".")[1] project = self._kwargs["project"] access_id = self._kwargs["access_id"] access_key = self._kwargs["access_key"] endpoint = self._kwargs.get("endpoint") partition = self._kwargs.get("partition", None) columns = self._kwargs.get("columns", None) pd = ODPSReader( access_id=access_id, access_key=access_key, project=project, endpoint=endpoint, table=table, partition=partition, num_processes=num_processes, transform_fn=transform_fn, columns=columns, ) pd.reset((start, end - start), shard_size) shard_count = pd.get_shards_count() for i in range(shard_count): records = pd.get_records() for record in records: yield record pd.stop()

Exemplo n.º 2

0

Exibir arquivo

Arquivo: odps_io_test.py Projeto: xinan-jiang/elasticdl

def test_parallel_read(self): def transform(record): return float(record[0]) + 1 start = 0 end = 100 shard_size = (end - start) // 4 pd = ODPSReader( access_id=self._access_id, access_key=self._access_key, project=self._project, endpoint=self._endpoint, table=self._test_read_table, num_processes=2, transform_fn=transform, ) results = [] pd.reset((start, end - start), shard_size) shard_count = pd.get_shards_count() for i in range(shard_count): records = pd.get_records() for record in records: results.append(record) pd.stop() self.assertEqual(len(results), 100)