Python DataHandling.store_data Exemples

Langage de programmation: Python

Espace de nommage/Pack: Utils

Class/Type: DataHandling

Méthode/Fonction: store_data

Exemples au hotexamples.com: 3

Python DataHandling.store_data - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de Utils.DataHandling.store_data extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

store_data(3)

load_data(2)

Méthodes fréquemment utilisées

store_data (3)

load_data (2)

Exemple #1

0

Afficher le fichier

Fichier : FeatureExtraction.py Projet : ffahimi/naive_recommender

def prepare_features(self, train_data, term_vectors): # main runner for feature extraction print ("... Preparing dataframe inclusing all words and tf-idf.") [article_word_count, word_tfidf, publishers, article_numbers] = self.prepare_dictionary_article(term_vectors) # Normalize Osfamily and Publisher [train_data, os_list, publisher_list] = self.normalize_features(train_data) DataHandling.store_data(Constants.model_path + "os_list.pickle", os_list) DataHandling.store_data(Constants.model_path + "publisher_list.pickle", publisher_list) # Calculate article popularity article_popularity = self.article_popularity(train_data, article_word_count, article_numbers) DataHandling.store_data(Constants.model_path + "article_popularity.pickle", article_popularity) # calculate distance array of articles print ("... Preparing training data including the article distances between original article and recommended.") train_data = self.prepare_training_article_distance(train_data, article_word_count, word_tfidf) DataHandling.store_data(Constants.model_path + "train_data_with_article_distances.pickle", train_data) return train_data, article_popularity, os_list, publisher_list

Exemple #2

0

Afficher le fichier

Fichier : train.py Projet : ffahimi/naive_recommender

#Taking only users that have historically clicked into training. train_data = train_data.loc[train_data['UserClicksAd'] > 0] #Balancing training data #Since the dataset is imbalanced, we balance negative and positive samples for training. # positive_samples = train_data.loc[train_data['Output'] == 1] # positive_samples_count = train_data.loc[train_data['Output'] == 1].shape[0] # negative_samples = train_data.loc[train_data['Output'] == 0] # rows = random.sample(negative_samples.index, positive_samples_count) # negative_samples = negative_samples.ix[rows] # train_data = pd.concat([positive_samples, negative_samples]) """ prepare the model and test it """ model = MYModel() model.trainBatch(train_data) DataHandling.store_data(Constants.model_path + 'Model_NB.pickle', model) #Cross-fold validation of training model scores = model.crossfoldValidation(train_data, 10) print(scores) """ #Pickle or CSV final training data (For testing and Matlab) # train_data = DataHandling.load_data(Constants.model_path + 'train_data_with_prediction_prob.pickle') # train_data.to_csv('prediction_file.csv') """

Exemple #3

0

Afficher le fichier

Fichier : MyModel.py Projet : ffahimi/naive_recommender

def trainBatch(self, train_data): self.classifier.train(train_data) print('... Pickling the model') DataHandling.store_data(Constants.model_path + 'classifier_NB.pickle', self.classifier)