Python DataHandling.store_data示例

编程语言: Python

命名空间/包名称: Utils

类/类型: DataHandling

方法/功能: store_data

hotexamples.com的示例: 3

Python DataHandling.store_data - 已找到3个示例。这些是从开源项目中提取的最受好评的Utils.DataHandling.store_data现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

store_data(3)

load_data(2)

示例#1

显示文件

文件： FeatureExtraction.py 项目： ffahimi/naive_recommender

    def prepare_features(self, train_data, term_vectors):

        # main runner for feature extraction
        print ("... Preparing dataframe inclusing all words and tf-idf.")
        [article_word_count, word_tfidf, publishers, article_numbers] = self.prepare_dictionary_article(term_vectors)

        # Normalize Osfamily and Publisher
        [train_data, os_list, publisher_list] = self.normalize_features(train_data)
        DataHandling.store_data(Constants.model_path + "os_list.pickle", os_list)
        DataHandling.store_data(Constants.model_path + "publisher_list.pickle", publisher_list)

        # Calculate article popularity
        article_popularity = self.article_popularity(train_data, article_word_count, article_numbers)
        DataHandling.store_data(Constants.model_path + "article_popularity.pickle", article_popularity)

        # calculate distance array of articles
        print ("... Preparing training data including the article distances between original article and recommended.")
        train_data = self.prepare_training_article_distance(train_data, article_word_count, word_tfidf)
        DataHandling.store_data(Constants.model_path + "train_data_with_article_distances.pickle", train_data)

        return train_data, article_popularity, os_list, publisher_list

示例#2

显示文件

文件： train.py 项目： ffahimi/naive_recommender

#Taking only users that have historically clicked into training.
train_data = train_data.loc[train_data['UserClicksAd'] > 0]

#Balancing training data
#Since the dataset is imbalanced, we balance negative and positive samples for training.
# positive_samples = train_data.loc[train_data['Output'] == 1]
# positive_samples_count = train_data.loc[train_data['Output'] == 1].shape[0]
# negative_samples = train_data.loc[train_data['Output'] == 0]
# rows = random.sample(negative_samples.index, positive_samples_count)
# negative_samples = negative_samples.ix[rows]
# train_data = pd.concat([positive_samples, negative_samples])

"""
prepare the model and test it
"""
model = MYModel()
model.trainBatch(train_data)
DataHandling.store_data(Constants.model_path + 'Model_NB.pickle', model)


#Cross-fold validation of training model
scores = model.crossfoldValidation(train_data, 10)
print(scores)


"""
#Pickle or CSV final training data (For testing and Matlab)
# train_data = DataHandling.load_data(Constants.model_path + 'train_data_with_prediction_prob.pickle')
# train_data.to_csv('prediction_file.csv')
"""

示例#3

显示文件

文件： MyModel.py 项目： ffahimi/naive_recommender

 def trainBatch(self, train_data):
     self.classifier.train(train_data)
     print('... Pickling the model')
     DataHandling.store_data(Constants.model_path + 'classifier_NB.pickle', self.classifier)