Ejemplos de SparkHiveDataSet.save en Python

Lenguaje de programación: Python

Namespace/Package Name: kedro.contrib.io.pyspark.spark_hive_data_set

Clase / Tipo: SparkHiveDataSet

Método / Función: save

Ejemplos en hotexamples.com: 4

Python SparkHiveDataSet.save - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de kedro.contrib.io.pyspark.spark_hive_data_set.SparkHiveDataSet.save extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

SparkHiveDataSet(11)

load(5)

save(4)

Métodos usados con frecuencia

SparkHiveDataSet (11)

load (5)

save (4)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_spark_hive_data_set.py Proyecto: zach-data/kedro

 def test_insert_to_non_existent_table(self):
     dataset = SparkHiveDataSet(database="default_1",
                                table="table_not_yet_created",
                                write_mode="insert")
     dataset.save(_generate_spark_df_one())
     assert_df_equal(dataset.load().sort("name"),
                     _generate_spark_df_one().sort("name"))

Ejemplo n.º 2

Mostrar archivo

Archivo: test_spark_hive_data_set.py Proyecto: zach-data/kedro

 def test_overwrite_empty_table(self, spark_hive_session):
     spark_hive_session.sql(
         "create table default_1.test_overwrite_empty_table (name string, age integer)"
     ).take(1)
     dataset = SparkHiveDataSet(
         database="default_1",
         table="test_overwrite_empty_table",
         write_mode="overwrite",
     )
     dataset.save(_generate_spark_df_one())
     assert_df_equal(dataset.load(), _generate_spark_df_one())

Ejemplo n.º 3

Mostrar archivo

Archivo: test_spark_hive_data_set.py Proyecto: zach-data/kedro

 def test_invalid_schema_insert(self, spark_hive_session):
     spark_hive_session.sql(
         "create table default_1.test_invalid_schema_insert "
         "(name string, additional_column_on_hive integer)").take(1)
     dataset = SparkHiveDataSet(
         database="default_1",
         table="test_invalid_schema_insert",
         write_mode="insert",
     )
     with pytest.raises(
             DataSetError,
             match=r"dataset does not match hive table schema\.\n"
             r"Present on insert only: \[\('age', 'int'\)\]\n"
             r"Present on schema only: \[\('additional_column_on_hive', 'int'\)\]",
     ):
         dataset.save(_generate_spark_df_one())

Ejemplo n.º 4

Mostrar archivo

Archivo: test_spark_hive_data_set.py Proyecto: zach-data/kedro

    def test_upsert_not_empty_table(self, spark_hive_session):
        spark_hive_session.sql(
            "create table default_1.test_upsert_not_empty_table (name string, age integer)"
        ).take(1)
        dataset = SparkHiveDataSet(
            database="default_1",
            table="test_upsert_not_empty_table",
            write_mode="upsert",
            table_pk=["name"],
        )
        dataset.save(_generate_spark_df_one())
        dataset.save(_generate_spark_df_upsert())

        assert_df_equal(
            dataset.load().sort("name"),
            _generate_spark_df_upsert_expected().sort("name"),
        )