Python empty_integer_df示例

编程语言: Python

命名空间/包名称: tests.spark

方法/功能: empty_integer_df

hotexamples.com的示例: 9

Python empty_integer_df - 已找到9个示例。这些是从开源项目中提取的最受好评的tests.spark.empty_integer_df现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def test_should_return_df_without_changes_if_empty_df_with_mean_constraint(
        spark_session):
    df = empty_integer_df(spark_session)

    result = ValidateSparkDataFrame(spark_session, df) \
        .mean_column_value("col1", 0, 1) \
        .execute()

    AssertValidationResult(column_name="col1", constraint_name="mean_between") \
        .check(
        actual=result,
        expected_correct=df,
        expected_erroneous=df
    )

示例#2

显示文件

文件： test_min_integer.py 项目： mikulskibartosz/pyspark-check

def test_should_reject_all_rows_if_smaller_than_min(spark_session):
    df = spark_session.createDataFrame([[5], [10], [15]],
                                       schema=single_integer_column_schema)

    result = ValidateSparkDataFrame(spark_session, df) \
        .is_min("col1", 20) \
        .execute()

    AssertValidationResult(column_name="col1", constraint_name="min") \
        .check(
        actual=result,
        expected_correct=empty_integer_df(spark_session),
        expected_erroneous=df
    )

示例#3

显示文件

文件： test_between_integer.py 项目： mikulskibartosz/pyspark-check

def test_should_return_df_without_changes_if_all_are_between(spark_session):
    df = spark_session.createDataFrame([[5], [10], [15]],
                                       schema=single_integer_column_schema)

    result = ValidateSparkDataFrame(spark_session, df) \
        .is_between("col1", 5, 15) \
        .execute()

    AssertValidationResult(column_name="col1", constraint_name="between") \
        .check(
        actual=result,
        expected_correct=df,
        expected_erroneous=empty_integer_df(spark_session)
    )

示例#4

显示文件

def test_should_reject_all_rows_if_mean_is_larger_than_given_values(
        spark_session):
    df = spark_session.createDataFrame([[5], [10], [15]],
                                       schema=single_integer_column_schema)

    result = ValidateSparkDataFrame(spark_session, df) \
        .mean_column_value("col1", 5, 8) \
        .execute()

    AssertValidationResult(column_name="col1", constraint_name="mean_between") \
        .check(
        actual=result,
        expected_correct=empty_integer_df(spark_session),
        expected_erroneous=df
    )

示例#5

显示文件

def test_should_throw_error_if_there_are_duplicate_constraints(spark_session):
    with pytest.raises(ValueError):
        ValidateSparkDataFrame(spark_session, empty_integer_df(spark_session)) \
            .mean_column_value("col1", 10, 10) \
            .mean_column_value("col1", 5, 5) \
            .execute()

示例#6

显示文件

def test_should_throw_error_if_constraint_uses_non_existing_column(
        spark_session):
    with pytest.raises(ValueError):
        ValidateSparkDataFrame(spark_session, empty_integer_df(spark_session)) \
            .mean_column_value("column_that_does_not_exist", 5, 5) \
            .execute()

示例#7

显示文件

文件： test_string_length.py 项目： mikulskibartosz/pyspark-check

def test_should_throw_error_if_constraint_is_not_a_text_column(spark_session):
    with pytest.raises(ValueError):
        ValidateSparkDataFrame(spark_session, empty_integer_df(spark_session)) \
            .has_length_between("col1", 5, 10) \
            .execute()

示例#8

显示文件

文件： test_string_matches.py 项目： mikulskibartosz/pyspark-check

def test_should_throw_error_if_constraint_is_not_a_text_column(spark_session):
    with pytest.raises(ValueError):
        ValidateSparkDataFrame(spark_session, empty_integer_df(spark_session)) \
            .text_matches_regex("col1", '[a-z]*') \
            .execute()

示例#9

显示文件

文件： test_between_integer.py 项目： mikulskibartosz/pyspark-check

def test_should_throw_error_if_lower_bound_is_greater_than_upper_bound(
        spark_session):
    with pytest.raises(ValueError):
        ValidateSparkDataFrame(spark_session, empty_integer_df(spark_session)) \
            .is_between("col1", 10, 5) \
            .execute()