Python Transformation.rename примеры использования

Язык программирования: Python

Пространство имен/Пакет: src.Pipeline

Класс/Тип: Transformation

Метод/Функция: rename

Примеров на hotexamples.com: 4

Python Transformation.rename - 4 примера найдено. Это лучшие примеры Python кода для src.Pipeline.Transformation.rename, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Transformation(20)

convert_data_type(5)

drop(5)

lowercase(4)

rename(4)

replace_null_values(4)

split_content(4)

replace_content(3)

Пример #1

Показать файл

    def test_should_return_same_columns_when_column_not_exist_in_df(self):
        transformation = Transformation(self.test_data)
        transformation.rename({"dt": "date"})

        current_result = transformation.dataframe.columns
        expected_result = self.test_data.columns

        self.assertEqual(current_result, expected_result)

Пример #2

Показать файл

    def test_should_return_same_columns_when_column_param_is_empty(self):
        transformation = Transformation(self.test_data)
        transformation.rename({})

        current_result = transformation.dataframe.columns
        expected_result = self.test_data.columns

        self.assertEqual(current_result, expected_result)

Пример #3

Показать файл

    def test_should_replace_two_columns_name(self):
        transformation = Transformation(self.test_data)
        transformation.rename({"mag": "magnitude", "status": "new_status"})

        current_result = transformation.dataframe.columns
        expected_result = [
            "date", "place", "magnitude", "new_status", "coordinates", "alert"
        ]

        self.assertEqual(current_result, expected_result)

Пример #4

Показать файл

Файл: test_spark_pipeline.py Проект: paty-oliveira/EarthQuake

    def test_should_return_transformed_data_using_all_pipeline_components(
            self, mock_get_data):
        self.create_tmp_folder()

        fake_api_input = ApiInput(self.FAKE_URL)
        mock_get_data.return_value = self.FAKE_INPUT_DATA

        extraction_process = Extraction(fake_api_input)
        extraction_process.extract()

        raw_data = extraction_process.data
        raw_df = self.spark.createDataFrame(
            raw_data,
            ["date", "place", "mag", "status", "coordinates", "alert"])

        transformation_process = Transformation(raw_df)
        transformation_process.drop(["alert"])
        transformation_process.rename({"mag": "magnitude", "place": "city"})
        transformation_process.replace_null_values({"status": "Automatic"})
        transformation_process.lowercase(["status"])
        transformation_process.convert_data_type({"date": IntegerType()})
        transformation_process.split_content(
            "coordinates", ["longitude", "latitude", "depth"])
        transformed_df = transformation_process.dataframe

        csv_storage = CsvStorage(self.OUTPUT_FILEPATH)
        loading_process = Loading(csv_storage)
        loading_process.load(transformed_df)

        current_result = self.spark \
            .read \
            .csv(self.OUTPUT_FILEPATH, header=True, inferSchema=True) \
            .collect()
        expected_result = self.spark \
            .createDataFrame(self.FAKE_EXPECTED_DATA,
                             ["date", "city", "magnitude", "status", "longitude", "latitude", "depth"]) \
            .collect()

        self.assertEqual(current_result, expected_result)

        self.delete_test_file()