Python XGBClassifier.summary 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: xgboost

클래스/타입: XGBClassifier

메소드/함수: summary

hotexamples.com에서의 예제들: 2

Python XGBClassifier.summary - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 xgboost.XGBClassifier.summary에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

get_params(30)

get_booster(30)

save_model(30)

score(30)

fit(30)

predict(30)

evals_result(30)

set_params(30)

XGBClassifier(30)

load_model(30)

predict_proba(30)

get_xgb_params(19)

add(13)

compile(12)

booster(10)

apply(6)

evaluate(5)

_Booster(5)

train(3)

predict_classes(3)

max_depth(2)

model_path(2)

predict_generator(2)

name(2)

plot_importance(2)

DMatrix(2)

get_all_params(2)

decision_function(2)

cv(2)

summary(2)

_le(2)

staged_decision_function(1)

save(1)

reg_lambda(1)

reg_alpha(1)

random_state(1)

subsample(1)

transform(1)

update(1)

use_relaxation_time_estimate(1)

scores(1)

learning_rate(1)

pred(1)

epsilon(1)

alpha(1)

best_round(1)

classes_(1)

colsample_bytree(1)

conf_int(1)

cov_params(1)

예제 #1

파일 보기

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn import linear_model
import statsmodels.api as sm
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score

scaler = StandardScaler()
names = [
    'Company_proficiency', 'Time_per_Unit', 'Innovation_Level', 'Quality',
    'Stats', 'Sustainability_Index'
]
dataset = pd.read_csv("dataset4.csv", names=names)
print(dataset.head())
print(dataset.describe().transpose())
print(dataset.shape)
X = dataset.drop('Sustainability_Index', axis=1)
Y = dataset['Sustainability_Index']
X_train, X_test, Y_train, Y_test = train_test_split(X, Y)

model = XGBClassifier()
predictions = model.predict(X)
model.fit(X_train, Y_train)

accuracy = accuracy_score(Y_test, predictions)

print(model.summary())

예제 #2

파일 보기

results=logit_model.fit()
print(results.summary2())

# Column names for reference above
df_column_name = pd.DataFrame(list(df_full_data.drop(['Attrition'], axis=1).columns.values))
df_column_name.index = np.arange(1, len(df_column_name) + 1)
df_column_name

import statsmodels.api as sm
import statsmodels.formula.api as smf
#logit_model=smf.Logit(y_train, X_train)
#results=logit_model.fit()
#print(results.summary2())

model= smf.logit(formula="Attrition~ Age + DailyRate + DistanceFromHome + EnvironmentSatisfaction + JobInvolvement + JobSatisfaction + NumCompaniesWorked + RelationshipSatisfaction + TotalWorkingYears + TrainingTimesLastYear + WorkLifeBalance + YearsAtCompany + MaritalStatus_Divorced + MaritalStatus_Married + MaritalStatus_Single + OverTime_No + OverTime_Yes", data= df_full_data).fit()
model.summary()

# GETTING THE ODDS RATIOS, Z-VALUE, AND 95% CI
model_odds = pd.DataFrame(np.exp(model.params), columns= ['OR'])
model_odds['z-value']= model.pvalues
model_odds[['2.5%', '97.5%']] = np.exp(model.conf_int())
model_odds

"""# Model 6: Neural Network"""

# Random seeds
np.random.seed(123)
rn.seed(123)
tf.set_random_seed(123)

# Convert Attrition to one-hot encoding for NN to be able to read