Python TFDataset.from_dataframe 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: zoo.tfpark

클래스/타입: TFDataset

메소드/함수: from_dataframe

hotexamples.com에서의 예제들: 2

Python TFDataset.from_dataframe - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 zoo.tfpark.TFDataset.from_dataframe에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

from_rdd(18)

from_ndarrays(10)

from_tf_data_dataset(7)

from_feature_set(4)

from_image_set(4)

from_dataframe(2)

from_tfrecord_file(2)

from_string_rdd(1)

from_tfrecord(1)

예제 #1

파일 보기

    def test_tfdataset_with_dataframe(self):
        rdd = self.sc.range(0, 1000)
        df = rdd.map(lambda x: (DenseVector(
            np.random.rand(20).astype(np.float)), x % 10)).toDF(
                ["feature", "label"])

        train_df, val_df = df.randomSplit([0.7, 0.3])
        dataset = TFDataset.from_dataframe(train_df,
                                           feature_cols=["feature"],
                                           labels_cols=["label"],
                                           batch_size=32,
                                           validation_df=val_df)

        seq = tf.keras.Sequential([
            tf.keras.layers.Flatten(input_shape=(20, )),
            tf.keras.layers.Dense(10, activation="softmax")
        ])

        seq.compile(optimizer=tf.keras.optimizers.RMSprop(),
                    loss='sparse_categorical_crossentropy',
                    metrics=['accuracy'])
        model = KerasModel(seq)
        model.fit(dataset)
        dataset = TFDataset.from_dataframe(val_df,
                                           feature_cols=["feature"],
                                           batch_per_thread=32)
        model.predict(dataset).collect()
        dataset = TFDataset.from_dataframe(val_df,
                                           feature_cols=["feature"],
                                           labels_cols=["label"],
                                           batch_per_thread=32)
        model.evaluate(dataset)

예제 #2

파일 보기

        def create_ds(mode):
            if mode == "train":
                dataset = TFDataset.from_dataframe(train_df,
                                                   feature_cols=["feature"],
                                                   labels_cols=["label"],
                                                   batch_size=32,
                                                   validation_df=val_df)
            elif mode == "predict":
                dataset = TFDataset.from_dataframe(val_df,
                                                   feature_cols=["feature"],
                                                   batch_per_thread=32)
            elif mode == "evaluate":
                dataset = TFDataset.from_dataframe(val_df,
                                                   feature_cols=["feature"],
                                                   labels_cols=["label"],
                                                   batch_per_thread=32)
            else:
                raise ValueError("unrecognized mode: {}".format(mode))

            return dataset