Python _train_val_split示例

编程语言: Python

命名空间/包名称: horovod.spark.common.util

方法/功能: _train_val_split

hotexamples.com的示例: 2

Python _train_val_split - 已找到2个示例。这些是从开源项目中提取的最受好评的horovod.spark.common.util._train_val_split现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： test_spark.py 项目： zhenghh04/horovod

    def test_train_val_split_ratio(self):
        with spark_session('test_train_val_split_ratio') as spark:
            data = [[1.0], [1.0], [1.0], [1.0], [1.0]]
            schema = StructType([StructField('data', FloatType())])
            df = create_test_data_from_schema(spark, data, schema)

            validation = 0.2
            train_df, val_df, validation_ratio = util._train_val_split(
                df, validation)

            # Only check validation ratio, as we can't rely on random splitting to produce an exact
            # result of 4 training and 1 validation samples.
            assert validation_ratio == validation

示例#2

显示文件

文件： test_spark.py 项目： yanggeng1995/horovod

    def test_train_val_split_col_boolean(self):
        with spark_session('test_train_val_split_col_boolean') as spark:
            data = [
                [1.0, False], [1.0, False], [1.0, False], [1.0, False], [1.0, True]
            ]
            schema = StructType([StructField('data', FloatType()), StructField('val', BooleanType())])
            df = create_test_data_from_schema(spark, data, schema)

            validation = 'val'
            train_df, val_df, validation_ratio = util._train_val_split(df, validation)

            # Only check counts as validation ratio cannot be guaranteed due to approx calculation
            assert train_df.count() == 4
            assert val_df.count() == 1