Python DataProcessor.load_processed_data Exemples

Langage de programmation: Python

Espace de nommage/Pack: data_processing

Class/Type: DataProcessor

Méthode/Fonction: load_processed_data

Exemples au hotexamples.com: 2

Python DataProcessor.load_processed_data - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de data_processing.DataProcessor.load_processed_data extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

DataProcessor(22)

saveResultToFile(5)

normalize(4)

denormalize(3)

get_train_test_data(3)

windowed_denormalize(3)

load(3)

windowed_normalize(3)

save(2)

get_dataframe_subset(2)

inverse_difference(2)

load_processed_data(2)

val_tokenzier(2)

plot(2)

difference(2)

process_data(2)

convert_array_to_np_array(2)

stop_print(1)

encode_hex_values(1)

train_tokenizer(1)

stop_store(1)

get_encoded_label_value(1)

stop(1)

start_store(1)

start_print(1)

get_examples(1)

complete_database_setup(1)

encode_ticket_hex_codes(1)

process_all_stats_for_year(1)

Méthodes fréquemment utilisées

DataProcessor (22)

saveResultToFile (5)

normalize (4)

denormalize (3)

get_train_test_data (3)

windowed_denormalize (3)

load (3)

windowed_normalize (3)

save (2)

get_dataframe_subset (2)

Méthodes fréquemment utilisées

inverse_difference (2)

load_processed_data (2)

val_tokenzier (2)

plot (2)

difference (2)

process_data (2)

convert_array_to_np_array (2)

stop_print (1)

encode_hex_values (1)

train_tokenizer (1)

stop_store (1)

get_encoded_label_value (1)

stop (1)

start_store (1)

start_print (1)

get_examples (1)

complete_database_setup (1)

encode_ticket_hex_codes (1)

process_all_stats_for_year (1)

Méthodes fréquemment utilisées

stop_store (1)

get_encoded_label_value (1)

stop (1)

start_store (1)

start_print (1)

get_examples (1)

complete_database_setup (1)

encode_ticket_hex_codes (1)

process_all_stats_for_year (1)

Exemple #1

0

Afficher le fichier

Fichier : random_forest_test.py Projet : BHennen/cs4033-5033-fa2019

def load_rf_data(cur_path): data_folder = "data\\titanic" processed_data_folder = os.path.join(cur_path, data_folder) # Note: Not using test.csv as it does not provide whether or not the passenger survived; therefore we cannot assess # how well the model performed. data_file_path = os.path.join(processed_data_folder, "train.csv") data = DataProcessor(data_file_path, processed_data_folder) try: #Try to load data data.load_processed_data() except FileNotFoundError: #No data found, so process it # 10% test, 10% validation, 80% training samples from data splits = (0.1, 0.1, 0.8) # Only use certain columns use_cols = ( # 0, #PassengerID 1, # Survived 2, # Pclass # 3, #Name 4, # Sex 5, # Age 6, # SibSp 7, # Parch # 8, #Ticket 9, # Fare # 10, #Cabin 11, # Embarked ) # Mark features as categorical (so we can one-hot-encode them later) # categorical_cols = () categorical_cols = (2, # Pclass 4, # Sex 11 # Embarked ) # Convert certain columns to float values (so we can use numpy arrays) converters = {4: lambda sex: {'male': 0.0, 'female': 1.0}[sex], 11: lambda embarked: {'S': 0.0, 'C': 1.0, 'Q': 2.0}[embarked]} data.process_data(splits=splits, use_cols=use_cols, categorical_cols=categorical_cols, converters=converters, filter_missing=True) return data

Exemple #2

0

Afficher le fichier

import sys from data_processing import DataProcessor from matplotlib import pyplot cur_path = os.path.dirname(__file__) data_folder = "data\\titanic" processed_data_folder = os.path.join(cur_path, data_folder) # Note: Not using test.csv as it does not provide whether or not the passenger survived; therefore we cannot assess # how well the model performed. data_file_path = os.path.join(processed_data_folder, "train.csv") data_processor = DataProcessor(data_file_path, processed_data_folder, "ffnn_processed.npz") # Load data try: # Try to load data data_processor.load_processed_data() except FileNotFoundError: # No data found, so process it # 20% test, 20% validation, 60% training samples from data splits = (0.2, 0.2, 0.6) # Only use certain columns use_cols = ( # 0, #PassengerID 1, # Survived 2, # Pclass # 3, #Name 4, # Sex 5, # Age 6, # SibSp 7, # Parch # 8, #Ticket