Esempi in Python per DatasetDict.from_parquet

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: datasets.dataset_dict

Classe/tipologia: DatasetDict

Metodo/funzione: from_parquet

Esempi su hotexamples.com: 3

DatasetDict.from_parquet in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per datasets.dataset_dict.DatasetDict.from_parquet, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

from_csv(4)

from_json(4)

from_text(4)

from_parquet(3)

load_from_disk(3)

map(3)

DatasetDict(2)

align_labels_with_mapping(1)

flatten(1)

flatten_(1)

values(1)

Esempio n. 1

Mostra file

File: test_dataset_dict.py Progetto: cahya-wirawan/datasets

def test_datasetdict_from_parquet_keep_in_memory(keep_in_memory, parquet_path,
                                                 tmp_path):
    cache_dir = tmp_path / "cache"
    expected_features = {
        "col_1": "string",
        "col_2": "int64",
        "col_3": "float64"
    }
    with assert_arrow_memory_increases(
    ) if keep_in_memory else assert_arrow_memory_doesnt_increase():
        dataset = DatasetDict.from_parquet({"train": parquet_path},
                                           cache_dir=cache_dir,
                                           keep_in_memory=keep_in_memory)
    _check_parquet_datasetdict(dataset, expected_features)

Esempio n. 2

Mostra file

File: test_dataset_dict.py Progetto: cahya-wirawan/datasets

def test_datasetdict_from_parquet_split(split, parquet_path, tmp_path):
    if split:
        path = {split: parquet_path}
    else:
        split = "train"
        path = {"train": parquet_path, "test": parquet_path}
    cache_dir = tmp_path / "cache"
    expected_features = {
        "col_1": "string",
        "col_2": "int64",
        "col_3": "float64"
    }
    dataset = DatasetDict.from_parquet(path, cache_dir=cache_dir)
    _check_parquet_datasetdict(dataset,
                               expected_features,
                               splits=list(path.keys()))
    assert all(dataset[split].split == split for split in path.keys())

Esempio n. 3

Mostra file

File: test_dataset_dict.py Progetto: cahya-wirawan/datasets

def test_datasetdict_from_parquet_features(features, parquet_path, tmp_path):
    cache_dir = tmp_path / "cache"
    default_expected_features = {
        "col_1": "string",
        "col_2": "int64",
        "col_3": "float64"
    }
    expected_features = features.copy(
    ) if features else default_expected_features
    features = (Features({
        feature: Value(dtype)
        for feature, dtype in features.items()
    }) if features is not None else None)
    dataset = DatasetDict.from_parquet({"train": parquet_path},
                                       features=features,
                                       cache_dir=cache_dir)
    _check_parquet_datasetdict(dataset, expected_features)