Python PandasDataset.expect_column_max_to_be_between примеры использования

Язык программирования: Python

Пространство имен/Пакет: great_expectations.dataset

Класс/Тип: PandasDataset

Метод/Функция: expect_column_max_to_be_between

Примеров на hotexamples.com: 2

Python PandasDataset.expect_column_max_to_be_between - 2 примера найдено. Это лучшие примеры Python кода для great_expectations.dataset.PandasDataset.expect_column_max_to_be_between, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

PandasDataset(7)

expect_column_values_to_be_between(6)

validate(6)

get_expectation_suite(5)

expect_column_values_to_be_in_set(4)

from_dataset(4)

expect_column_max_to_be_between(2)

expect_column_values_to_be_in_type_list(2)

_append_expectation(1)

copy(1)

expect_column_min_to_be_between(1)

expect_column_to_exist(1)

expect_column_values_to_be_null(1)

expect_column_values_to_not_be_null(1)

set_evaluation_parameter(1)

Пример #1

Показать файл

Файл: test_validation.py Проект: feast-dev/feast

def profiler_with_unrealistic_expectations(
        dataset: PandasDataset) -> ExpectationSuite:
    # need to create dataframe with corrupted data first
    df = pd.DataFrame()
    df["current_balance"] = [-100]
    df["avg_passenger_count"] = [0]

    other_ds = PandasDataset(df)
    other_ds.expect_column_max_to_be_between("current_balance", -1000, -100)
    other_ds.expect_column_values_to_be_in_set("avg_passenger_count",
                                               value_set={0})

    # this should pass
    other_ds.expect_column_min_to_be_between("avg_passenger_count", 0, 1000)

    return other_ds.get_expectation_suite()

Пример #2

Показать файл

def test_pandas_datetime_evaluation_parameter():
    evaluation_parameters = {
        "now": pd.Timestamp.now(),
        "now_minus_48h": pd.Timestamp.now() - pd.to_timedelta(2, unit="d"),
    }

    test_data = {
        "data_refresh": [
            pd.Timestamp.now(),
            (pd.Timestamp.now() - pd.to_timedelta(1, unit="d")),
        ]
    }
    _df = pd.DataFrame(test_data)
    df = PandasDataset(_df)

    for param in evaluation_parameters:
        df.set_evaluation_parameter(param, evaluation_parameters[param])
    df.expect_column_max_to_be_between(
        column="data_refresh", min_value={"$PARAMETER": "now_minus_48h"})

    result = df.validate()

    assert result.success