Python XGBRegressor.Features 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: xgboost

클래스/타입: XGBRegressor

메소드/함수: Features

hotexamples.com에서의 예제들: 1

Python XGBRegressor.Features - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 xgboost.XGBRegressor.Features에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

save_model(30)

fit(30)

load_model(30)

XGBRegressor(30)

get_params(17)

get_booster(15)

evals_result(15)

predict(14)

set_params(13)

score(12)

booster(10)

predict_proba(6)

compile(4)

_Booster(3)

get_xgb_params(3)

rescaleFactor(2)

rescaleConstant(2)

normalizationMethod(2)

trees(2)

multiple_model_method(2)

classes(2)

add(2)

transformedOutputs(2)

save(1)

seed(1)

train(1)

transform(1)

summary(1)

DMatrix(1)

sample_rate(1)

reset_states(1)

predict_classes(1)

plot_importance(1)

Features(1)

get_model_name(1)

feature_importance(1)

evaluate(1)

__init__(1)

n_estimators(1)

예제 #1

파일 보기

파일: main.py 프로젝트: ecmulli/sales-app

def create_predictions_sales(train, test, load_or_run='run'):
    sub = train.drop(['Customers', 'Date'], axis=1)
    subtest = test.drop(['Sales', 'Customers', 'Date'], axis=1)

    subtest.Open = subtest.Open.astype('int')
    for c in sub.columns:
        if sub[c].dtype == 'object' or sub[c].dtype.name == 'category':
            print(c)
            lbl = preprocessing.LabelEncoder()
            lbl.fit(list(sub[c].values))
            sub[c] = lbl.transform(sub[c].values)

    for c in subtest.columns:
        if subtest[c].dtypes == 'object' or subtest[c].dtype.name == 'category':
            print(c)
            lbl = preprocessing.LabelEncoder()
            lbl.fit(list(subtest[c].values))
            subtest[c] = lbl.transform(subtest[c].values)

    target = np.array(sub.Sales)
    sub = sub.drop('Sales', axis=1)
    traincols = sub.columns
    sub = np.array(sub)
    subtest = np.array(subtest)

    trn, tst, trgt_train, trgt_test = train_test_split(sub,
                                                       target,
                                                       test_size=.3,
                                                       random_state=42)

    def rmse(preds, target):
        error = np.sqrt(((preds - target)**2).mean())
        print(error)
        return (error)

    def mae(preds, target):
        error = np.mean(abs(preds - target))
        print(error)
        return (error)

    if load_or_run == 'load':
        xg = joblib.load("sales2.joblib.dat")
        print('loaded')

    else:
        param_grid = {
            'n_jobs': [4],
            'learning_rate': [.05, .1, .2],
            'max_depth': [8, 10],
            'n_estimators': [500],
            'booster': ['gbtree'],
            'gamma': [0],
            'subsample': [1],
            'colsample_bytree': [1]
        }
        xg = XGBRegressor(silent=0)
        xg = GridSearchCV(xg, param_grid)
        xg.fit(X=trn, y=trgt_train)
        xg.Features = traincols
        joblib.dump(xg, "sales2.joblib.dat")
        print('ran')


#    feats = pd.DataFrame({'feats': traincols, 'importances':xg2.feature_importances_})
#    feats.plot.bar( )
    print(xg.best_estimator_)
    preds = xg.predict(tst)
    rmse(preds, trgt_test)
    mae(preds, trgt_test)
    testpreds = xg.predict(subtest)
    trainpreds = xg.predict(sub)
    #
    #    rf = RandomForestRegressor(n_estimators = 500, random_state = 42, n_jobs = 4)
    #    rf.fit(trn, trgt_train)
    #    preds = rf.predict(tst)
    #    rmse(preds, trgt_test)
    #    mae(preds, trgt_test)

    return (trainpreds, testpreds)