Python load_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: datasets.dummy.preprocessing

메소드/함수: load_data

hotexamples.com에서의 예제들: 2

Python load_data - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 datasets.dummy.preprocessing.load_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

from hpo_framework.hp_spaces import space_keras, space_rf, space_svr, space_xgb, space_ada, space_dt, space_linr, space_knn_r

from hpo_framework.hpo_metrics import root_mean_squared_error
import datasets.dummy.preprocessing as pp
from hpo_framework.trial import Trial

# Loading data and preprocessing
# >>> Linux OS and Windows require different path representations -> use pathlib <<<
abs_folder_path = os.path.abspath(path='datasets/dummy')
data_folder = Path(abs_folder_path)
train_file = "train.csv"
test_file = "test.csv"
submission_file = "sample_submission.csv"

train_raw = pp.load_data(data_folder, train_file)
test_raw = pp.load_data(data_folder, test_file)

X_train, y_train, X_val, y_val, X_test = pp.process(train_raw,
                                                    test_raw,
                                                    standardization=False,
                                                    logarithmic=False,
                                                    count_encoding=False)

# Flag for debug mode (yes/no)
# yes (True) -> set parameters for this trial in source code (below)
# no (False) -> call script via terminal and pass arguments via argparse
debug = False

if debug:
    # Set parameters manually

예제 #2

파일 보기

from skopt.optimizer import gp_minimize
from skopt.optimizer import forest_minimize
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
from math import sqrt
from tensorflow import keras
import matplotlib.pyplot as plt

from datasets.dummy import preprocessing as pp

FOLDER = r'C:\Users\Max\Documents\GitHub\housing_regression\datasets'
TRAIN_FILE = 'train.csv'
TEST_FILE = 'test.csv'
SAMPLE_SUB = 'sample_submission.csv'

train_raw = pp.load_data(FOLDER, TRAIN_FILE)
test_raw = pp.load_data(FOLDER, TEST_FILE)

X_train, y_train, X_val, y_val, X_test = pp.process(train_raw,
                                                    test_raw,
                                                    standardization=False,
                                                    logarithmic=False,
                                                    count_encoding=False)
# ML-algorithm
ALGORITHM = 'RandomForestRegressor'  # 'RandomForestRegressor', 'Keras'
# HPO-method
OPTIMIZER = 'SMAC'  # 'GPBO', 'SMAC'


def train_evaluate_rf(X_train, y_train, X_val, y_val, params):
    rf_reg = RandomForestRegressor(**params, random_state=0)