Python Datasource示例

编程语言: Python

命名空间/包名称: ray.data.datasource

类/类型: Datasource

hotexamples.com的示例: 2

Python Datasource - 已找到2个示例。这些是从开源项目中提取的最受好评的ray.data.datasource.Datasource现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

create_reader(1)

prepare_read(1)

示例#1

显示文件

文件： read_api.py 项目： parasj/ray

def _get_read_tasks(
    ds: Datasource,
    ctx: DatasetContext,
    cur_pg: Optional[PlacementGroup],
    parallelism: int,
    kwargs: dict,
) -> (int, int, List[ReadTask]):
    """Generates read tasks.

    Args:
        ds: Datasource to read from.
        ctx: Dataset config to use.
        cur_pg: The current placement group, if any.
        parallelism: The user-requested parallelism, or -1 for autodetection.
        kwargs: Additional kwargs to pass to the reader.

    Returns:
        Request parallelism from the datasource, the min safe parallelism to avoid
        OOM, and the list of read tasks generated.
    """
    kwargs = _unwrap_arrow_serialization_workaround(kwargs)
    DatasetContext._set_current(ctx)
    reader = ds.create_reader(**kwargs)
    requested_parallelism, min_safe_parallelism = _autodetect_parallelism(
        parallelism, cur_pg, DatasetContext.get_current(), reader)
    return (
        requested_parallelism,
        min_safe_parallelism,
        reader.get_read_tasks(requested_parallelism),
    )

示例#2

显示文件

def _prepare_read(ds: Datasource, ctx: DatasetContext, parallelism: int,
                  kwargs: dict) -> List[ReadTask]:
    kwargs = _unwrap_s3_filesystem_workaround(kwargs)
    DatasetContext._set_current(ctx)
    return ds.prepare_read(parallelism, **kwargs)