Python ParquetDataSetの例

プログラミング言語: Python

名前空間/パッケージ名: kedro.extras.datasets.dask

クラス/型: ParquetDataSet

hotexamples.comのコード掲載数: 6

Python ParquetDataSet - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのkedro.extras.datasets.dask.ParquetDataSetの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

ParquetDataSet(6)

load(4)

exists(1)

save(1)

よく使われるメソッド

ParquetDataSet (6)

load (4)

exists (1)

save (1)

コード例 #1

ファイルを表示

ファイル: test_parquet_dataset.py プロジェクト: zach-data/kedro

 def test_empty_credentials_load(self, bad_credentials):
     parquet_data_set = ParquetDataSet(
         filepath=S3_PATH, credentials={"client_kwargs": bad_credentials}
     )
     pattern = r"Failed while loading data from data set ParquetDataSet\(.+\)"
     with pytest.raises(DataSetError, match=pattern):
         parquet_data_set.load().compute()

コード例 #2

ファイルを表示

ファイル: test_parquet_dataset.py プロジェクト: zschuster/kedro

    def test_pass_credentials(self, mocker):
        """Test that AWS credentials are passed successfully into boto3
        client instantiation on creating S3 connection."""
        mocker.patch("s3fs.core.boto3.Session.client")
        s3_data_set = ParquetDataSet(
            filepath=S3_PATH, credentials={"client_kwargs": AWS_CREDENTIALS})
        pattern = r"Failed while loading data from data set ParquetDataSet\(.+\)"
        with pytest.raises(DataSetError, match=pattern):
            s3_data_set.load().compute()

        assert s3fs.core.boto3.Session.client.call_count == 1
        args, kwargs = s3fs.core.boto3.Session.client.call_args_list[0]
        assert args == ("s3", )
        for k, v in AWS_CREDENTIALS.items():
            assert kwargs[k] == v

コード例 #3

ファイルを表示

    def test_pass_credentials(self, mocker):
        """Test that AWS credentials are passed successfully into boto3
        client instantiation on creating S3 connection."""
        client_mock = mocker.patch("botocore.session.Session.create_client")
        s3_data_set = ParquetDataSet(filepath=S3_PATH,
                                     credentials=AWS_CREDENTIALS)
        pattern = r"Failed while loading data from data set ParquetDataSet\(.+\)"
        with pytest.raises(DataSetError, match=pattern):
            s3_data_set.load().compute()

        assert client_mock.call_count == 1
        args, kwargs = client_mock.call_args_list[0]
        assert args == ("s3", )
        assert kwargs["aws_access_key_id"] == AWS_CREDENTIALS["key"]
        assert kwargs["aws_secret_access_key"] == AWS_CREDENTIALS["secret"]

コード例 #4

ファイルを表示

ファイル: test_parquet_dataset.py プロジェクト: zschuster/kedro

def s3_data_set(load_args, save_args):
    return ParquetDataSet(
        filepath=S3_PATH,
        credentials={"client_kwargs": AWS_CREDENTIALS},
        load_args=load_args,
        save_args=save_args,
    )

コード例 #5

ファイルを表示

ファイル: test_parquet_dataset.py プロジェクト: zach-data/kedro

 def test_incorrect_credentials_load(self):
     """Test that incorrect credential keys won't instantiate dataset."""
     pattern = r"unexpected keyword argument"
     with pytest.raises(DataSetError, match=pattern):
         ParquetDataSet(
             filepath=S3_PATH,
             credentials={
                 "client_kwargs": {"access_token": "TOKEN", "access_key": "KEY"}
             },
         ).load().compute()

コード例 #6

ファイルを表示

ファイル: test_parquet_dataset.py プロジェクト: zschuster/kedro

    def test_save_load_locally(self, tmp_path, dummy_dd_dataframe):
        """Test loading the data locally."""
        file_path = str(tmp_path / "some" / "dir" / FILE_NAME)
        data_set = ParquetDataSet(filepath=file_path)

        assert not data_set.exists()
        data_set.save(dummy_dd_dataframe)
        assert data_set.exists()
        loaded_data = data_set.load()
        dummy_dd_dataframe.compute().equals(loaded_data.compute())