Python to_petastorm_fn示例

编程语言: Python

命名空间/包名称: horovod.spark.common.util

方法/功能: to_petastorm_fn

hotexamples.com的示例: 2

Python to_petastorm_fn - 已找到2个示例。这些是从开源项目中提取的最受好评的horovod.spark.common.util.to_petastorm_fn现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

 def to_petastorm(df):
     metadata = None
     if util._has_vector_column(df):
         to_petastorm = util.to_petastorm_fn(["features", "y"],
                                             metadata)
         df = df.rdd.map(to_petastorm).toDF()
     return df

示例#2

显示文件

文件： test_spark_lightning.py 项目： tallamjr/horovod

    def test_prepare_data(self):
        with spark_session('test_prepare_data') as spark:
            df = create_xor_data(spark)

            train_rows = df.count()
            schema_cols = ['features', 'y']
            metadata = util._get_metadata(df)
            assert metadata['features']['intermediate_format'] == constants.ARRAY

            to_petastorm = util.to_petastorm_fn(schema_cols, metadata)
            modified_df = df.rdd.map(to_petastorm).toDF()
            data = modified_df.collect()

            prepare_data = remote._prepare_data_fn(metadata)
            features = torch.tensor([data[i].features for i in range(train_rows)])
            features_prepared = prepare_data('features', features)
            assert np.array_equal(features_prepared, features)