Esempi in Python per ParquetDataSet

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: kedro.extras.datasets.dask

Classe/tipologia: ParquetDataSet

Esempi su hotexamples.com: 6

ParquetDataSet in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per kedro.extras.datasets.dask.ParquetDataSet, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ParquetDataSet(6)

load(4)

exists(1)

save(1)

Metodi utilizzati di frequente

ParquetDataSet (6)

load (4)

exists (1)

save (1)

Esempio n. 1

Mostra file

File: test_parquet_dataset.py Progetto: zach-data/kedro

 def test_empty_credentials_load(self, bad_credentials):
     parquet_data_set = ParquetDataSet(
         filepath=S3_PATH, credentials={"client_kwargs": bad_credentials}
     )
     pattern = r"Failed while loading data from data set ParquetDataSet\(.+\)"
     with pytest.raises(DataSetError, match=pattern):
         parquet_data_set.load().compute()

Esempio n. 2

Mostra file

File: test_parquet_dataset.py Progetto: zschuster/kedro

    def test_pass_credentials(self, mocker):
        """Test that AWS credentials are passed successfully into boto3
        client instantiation on creating S3 connection."""
        mocker.patch("s3fs.core.boto3.Session.client")
        s3_data_set = ParquetDataSet(
            filepath=S3_PATH, credentials={"client_kwargs": AWS_CREDENTIALS})
        pattern = r"Failed while loading data from data set ParquetDataSet\(.+\)"
        with pytest.raises(DataSetError, match=pattern):
            s3_data_set.load().compute()

        assert s3fs.core.boto3.Session.client.call_count == 1
        args, kwargs = s3fs.core.boto3.Session.client.call_args_list[0]
        assert args == ("s3", )
        for k, v in AWS_CREDENTIALS.items():
            assert kwargs[k] == v

Esempio n. 3

Mostra file

    def test_pass_credentials(self, mocker):
        """Test that AWS credentials are passed successfully into boto3
        client instantiation on creating S3 connection."""
        client_mock = mocker.patch("botocore.session.Session.create_client")
        s3_data_set = ParquetDataSet(filepath=S3_PATH,
                                     credentials=AWS_CREDENTIALS)
        pattern = r"Failed while loading data from data set ParquetDataSet\(.+\)"
        with pytest.raises(DataSetError, match=pattern):
            s3_data_set.load().compute()

        assert client_mock.call_count == 1
        args, kwargs = client_mock.call_args_list[0]
        assert args == ("s3", )
        assert kwargs["aws_access_key_id"] == AWS_CREDENTIALS["key"]
        assert kwargs["aws_secret_access_key"] == AWS_CREDENTIALS["secret"]

Esempio n. 4

Mostra file

File: test_parquet_dataset.py Progetto: zschuster/kedro

def s3_data_set(load_args, save_args):
    return ParquetDataSet(
        filepath=S3_PATH,
        credentials={"client_kwargs": AWS_CREDENTIALS},
        load_args=load_args,
        save_args=save_args,
    )

Esempio n. 5

Mostra file

File: test_parquet_dataset.py Progetto: zach-data/kedro

 def test_incorrect_credentials_load(self):
     """Test that incorrect credential keys won't instantiate dataset."""
     pattern = r"unexpected keyword argument"
     with pytest.raises(DataSetError, match=pattern):
         ParquetDataSet(
             filepath=S3_PATH,
             credentials={
                 "client_kwargs": {"access_token": "TOKEN", "access_key": "KEY"}
             },
         ).load().compute()

Esempio n. 6

Mostra file

File: test_parquet_dataset.py Progetto: zschuster/kedro

    def test_save_load_locally(self, tmp_path, dummy_dd_dataframe):
        """Test loading the data locally."""
        file_path = str(tmp_path / "some" / "dir" / FILE_NAME)
        data_set = ParquetDataSet(filepath=file_path)

        assert not data_set.exists()
        data_set.save(dummy_dd_dataframe)
        assert data_set.exists()
        loaded_data = data_set.load()
        dummy_dd_dataframe.compute().equals(loaded_data.compute())