Ejemplos de DataCatalog.DataCatalog en Python

Lenguaje de programación: Python

Namespace/Package Name: kedro.io

Clase / Tipo: DataCatalog

Método / Función: DataCatalog

Ejemplos en hotexamples.com: 13

Python DataCatalog.DataCatalog - 13 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de kedro.io.DataCatalog.DataCatalog extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

from_config(30)

save(16)

load(15)

DataCatalog(13)

add(10)

_get_dataset(5)

release(5)

add_transformer(4)

list(4)

confirm(3)

exists(3)

shallow_copy(2)

add_all(1)

add_feed_dict(1)

set_version_journal(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_sequential_runner.py Proyecto: MerelTheisenQB/kedro

 def test_no_input_seq(self, is_async, branchless_no_input_pipeline):
     outputs = SequentialRunner(is_async=is_async).run(
         branchless_no_input_pipeline, DataCatalog())
     assert "E" in outputs
     assert len(outputs) == 1

Ejemplo n.º 2

Mostrar archivo

Archivo: test_pipeline_ml.py Proyecto: lawwu/kedro-mlflow

def dummy_catalog():
    return DataCatalog({
        "raw_data": MemoryDataSet(),
        "data": MemoryDataSet(),
        "model": CSVDataSet("fake/path/to/file.csv"),
    })

Ejemplo n.º 3

Mostrar archivo

Archivo: test_sequential_runner.py Proyecto: MerelTheisenQB/kedro

def memory_catalog():
    ds1 = MemoryDataSet({"data": 42})
    ds2 = MemoryDataSet([1, 2, 3, 4, 5])
    return DataCatalog({"ds1": ds1, "ds2": ds2})

Ejemplo n.º 4

Mostrar archivo

Archivo: test_sequential_runner.py Proyecto: MerelTheisenQB/kedro

 def test_confirms(self, mocker, pipeline, is_async):
     fake_dataset_instance = mocker.Mock()
     catalog = DataCatalog(data_sets={"ds1": fake_dataset_instance})
     SequentialRunner(is_async=is_async).run(pipeline, catalog)
     fake_dataset_instance.confirm.assert_called_once_with()

Ejemplo n.º 5

Mostrar archivo

Archivo: test_sequential_runner.py Proyecto: MerelTheisenQB/kedro

 def test_node_returning_none(self, is_async, saving_none_pipeline):
     pattern = "Saving `None` to a `DataSet` is not allowed"
     with pytest.raises(DataSetError, match=pattern):
         SequentialRunner(is_async=is_async).run(saving_none_pipeline,
                                                 DataCatalog())

Ejemplo n.º 6

Mostrar archivo

Archivo: test_sequential_runner.py Proyecto: MerelTheisenQB/kedro

 def test_unsatisfied_inputs(self, is_async, unfinished_outputs_pipeline):
     """ds1, ds2 and ds3 were not specified."""
     with pytest.raises(ValueError, match=r"not found in the DataCatalog"):
         SequentialRunner(is_async=is_async).run(
             unfinished_outputs_pipeline, DataCatalog())

Ejemplo n.º 7

Mostrar archivo

def catalog():
    return DataCatalog()

Ejemplo n.º 8

Mostrar archivo

Archivo: test_sequential_runner.py Proyecto: MerelTheisenQB/kedro

 def test_no_data_sets(self, is_async, branchless_pipeline):
     catalog = DataCatalog({}, {"ds1": 42})
     outputs = SequentialRunner(is_async=is_async).run(
         branchless_pipeline, catalog)
     assert "ds3" in outputs
     assert outputs["ds3"] == 42

Ejemplo n.º 9

Mostrar archivo

def multi_catalog():
    csv = CSVLocalDataSet(filepath="abc.csv")
    parq = ParquetLocalDataSet(filepath="xyz.parq")
    return DataCatalog({"abc": csv, "xyz": parq})

Ejemplo n.º 10

Mostrar archivo

 def test_save_to_unregistered(self, dummy_dataframe):
     """Check the error when attempting to save to unregistered data set"""
     catalog = DataCatalog(data_sets={})
     pattern = r"DataSet 'test' not found in the catalog"
     with pytest.raises(DataSetNotFoundError, match=pattern):
         catalog.save("test", dummy_dataframe)

Ejemplo n.º 11

Mostrar archivo

 def test_load_from_unregistered(self):
     """Check the error when attempting to load unregistered data set"""
     catalog = DataCatalog(data_sets={})
     pattern = r"DataSet 'test' not found in the catalog"
     with pytest.raises(DataSetNotFoundError, match=pattern):
         catalog.load("test")

Ejemplo n.º 12

Mostrar archivo

def data_catalog(data_set):
    return DataCatalog(data_sets={"test": data_set})

Ejemplo n.º 13

Mostrar archivo

Archivo: test_parallel_runner.py Proyecto: zeta1999/kedro

 def test_node_returning_none(self, is_async):
     pipeline = Pipeline([node(identity, "A", "B"), node(return_none, "B", "C")])
     catalog = DataCatalog({"A": MemoryDataSet("42")})
     pattern = "Saving `None` to a `DataSet` is not allowed"
     with pytest.raises(DataSetError, match=pattern):
         ParallelRunner(is_async=is_async).run(pipeline, catalog)