Python Data.processing_test_dataの例

プログラミング言語: Python

名前空間/パッケージ名: data_processing

クラス/型: Data

メソッド/関数: processing_test_data

hotexamples.comのコード掲載数: 2

Python Data.processing_test_data - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdata_processing.Data.processing_test_dataの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Data(9)

processing(5)

train_test_split_by_date(3)

predict_label(2)

processing_test_data(2)

cat_to_num(1)

create_data(1)

duplicate_data(1)

get_feature_count(1)

get_missing_value_count(1)

get_true_label(1)

get_y_cats(1)

split_data(1)

stand_data(1)

to_label(1)

コード例 #1

ファイルを表示

    eval_reg.fit(X_train, y_train)

    print("-" * 10, "regression report", "-" * 10)
    report = regression_report(y_test, eval_reg.predict(X_test),
                               X_test.shape[1])
    print(report)

    print("-" * 10, "evaluation of label", "-" * 10)
    label_df = data.get_true_label(
        columns=["adr", "revenue", "is_canceled", "label"])
    pred_label_df = data.predict_label(eval_reg, X_test_df)

    print("[ label evaluation ]")
    report_label = evaluate_by_label(pred_label_df, label_df, target="label")
    print(report_label)
    print("[ revenue_per_day evaluation ]")
    report_revenue = evaluate_by_label(pred_label_df,
                                       label_df,
                                       target="revenue")
    print(report_revenue)

    #%% training with all data
    X_df, y_df = data.processing(["revenue"])
    reg = HistGradientBoostingRegressor(random_state=1129)
    reg.fit(X_df.to_numpy(), y_df["revenue"].to_numpy())

    #%% fill predict label to csv
    test_X_df = data.processing_test_data("data/test.csv")
    predict_df = data.predict_label(reg, test_X_df)
    fill_label(predict_df, "data/test_nolabel.csv")

コード例 #2

ファイルを表示

ファイル: mae_0.31(0.85)_stacking.py プロジェクト: PM25/Kaggle-Hotel-Revenue-Prediction

        revenue_pred = reg.predict(X_df)
        revenue_preds.append(revenue_pred)
    revenue_pred = np.sum(revenue_preds, axis=0) / len(revenue_preds)

    # print report
    report = []
    report.append("[ revenue_per_order evaluation ]")
    y_test = y_test_df["revenue"].to_numpy()
    reg_report = regression_report(y_test, revenue_pred, X_test_df.shape[1])
    report.append(reg_report)

    pred_df = X_test_df.copy()
    pred_df["pred_revenue"] = revenue_pred
    pred_label_df = data.to_label(pred_df)
    true_label_df = data.get_true_label(
        columns=["adr", "revenue", "is_canceled", "label"])

    report.append("[ label evaluation ]")
    report.append(evaluate_by_label(pred_label_df, true_label_df, "label"))
    report.append("[ revenue_per_day evaluation ]")
    report.append(evaluate_by_label(pred_label_df, true_label_df, "revenue"))
    report = "\n".join(report) + "\n"
    print(report)

    # training with all data
    X_df, y_df = data.processing(["revenue", "is_canceled", "adr"])
    regs = split_train(regressor, X_df, y_df, nsplit)

    test_X_df = data.processing_test_data()
    save_output(regs, test_X_df)