Python DataUtils.get_regression_dataの例

プログラミング言語: Python

名前空間/パッケージ名: data_utils

クラス/型: DataUtils

メソッド/関数: get_regression_data

hotexamples.comのコード掲載数: 1

Python DataUtils.get_regression_data - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdata_utils.DataUtils.get_regression_dataの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

DataUtils(28)

message(26)

get_filename(10)

update_message(8)

create_onehot_vectors(8)

load_embeddings(7)

load_array(6)

get_processed_df(6)

save_array(6)

load_data(5)

remove_html(5)

create_int_dict(4)

normalize_cases(4)

load_corpus(4)

parse_dependency_tree(4)

extract_tag_list(4)

add_suffix_embeddings(4)

get_date_from_row(3)

batch_fetch_ids_for_query(3)

training_inputs(3)

training_classes(3)

get_low_from_row(3)

testing_inputs(3)

get_bb_query_msg(3)

read_data(3)

testing_classes(3)

extract_data(3)

remove_excess_spaces(2)

data_preprocess(2)

parse_bb_data_msg(2)

create_dir(2)

expand_var_names(2)

extract_tag_dict(2)

extract_word_data(2)

get_high_from_row(2)

batch_fetch_docs_for_ids(2)

parse_bb_variable_msg(1)

remove_whitespace(1)

parse_bb_latest_data_msg(1)

pre_process_aws(1)

tag_id(1)

pre_process_col_tweets(1)

get_regression_data(1)

load_vocab(1)

get_class_label(1)

augmentation(1)

build_pad_config(1)

cartesian(1)

check_and_create_folders(1)

create_cache_if_not_exists(1)

コード例 #1

ファイルを表示

ファイル: pka_regression.py プロジェクト: joennlae/mol_property

import os
import numpy as np
import xgboost as xgb
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import r2_score, mean_squared_error
from sklearn.externals import joblib

from data_utils import DataUtils

# basic_only | acidic only
DATA_CATEGORY = "basic_only"
FEATURE_TYPE = "morgan+macc"

cur_dir = os.path.dirname(__file__)
d_utils = DataUtils(filepath=os.path.join(cur_dir, "data/pKaInWater.csv"))
X_data, y_data = d_utils.get_regression_data(data_category=DATA_CATEGORY, feature_type=FEATURE_TYPE)

# train test split
seed = 7
X_train, X_test, y_train, y_test = train_test_split(X_data, y_data, test_size=0.2, random_state=seed)
print("\n ========================= \n")
print("X_train.shape:", X_train.shape, "X_test.shape", X_test.shape)
print("\n ========================= \n")


def model_evaluation(model, x_input, y_input):
    y_pred = model.predict(x_input)
    rmse_value = np.sqrt(mean_squared_error(y_true=y_input, y_pred=y_pred))
    r2_value = r2_score(y_true=y_input, y_pred=y_pred)
    return rmse_value, r2_value