Python RandomForestClassifier.feature_importances_ 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sklearn.ensemble

메소드/함수: feature_importances_

hotexamples.com에서의 예제들: 2

Python RandomForestClassifier.feature_importances_ - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sklearn.ensemble.RandomForestClassifier.feature_importances_에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

add(30)

fit(30)

RandomForestClassifier(30)

apply(30)

get_params(30)

decision_path(24)

compile(22)

decision_function(17)

fit_transform(12)

n_estimators(12)

n_classes_(12)

evaluate(11)

__init__(11)

classes_(10)

estimators_(7)

max_depth(4)

error(3)

min_samples_leaf(3)

class_weight(3)

lower(3)

eval(2)

input_features(2)

expand(2)

id(2)

encode(2)

feature_importances_(2)

feature_names(2)

fit_predict(2)

C(2)

criterion(2)

max_features(2)

mlinit(2)

compress(2)

Predict(2)

base_estimator(2)

append(2)

output_feature(2)

_get_param_names(2)

get_variable_value(1)

variable_feature_importances(1)

values(1)

get_weights(1)

get_xgb_params(1)

predicted_proba(1)

name1(1)

k_best(1)

min_weight_fraction_leaf(1)

make_classification(1)

kneighbors(1)

min_samples_split(1)

예제 #1

파일 보기

파일: models.py 프로젝트: afcarl/telstra

def abclassifier(training_samples, eval_samples):
    X_train, Y_train = training_samples
    X_eval, Y_eval = eval_samples
    do_grid_search=False
    clf = RandomForestClassifier(n_estimators=2000, criterion='gini', max_depth=None, 
                                 min_samples_split=8, min_samples_leaf=1, min_weight_fraction_leaf=0.0, 
                                 max_features=40, max_leaf_nodes=None, bootstrap=True, oob_score=False, 
                                 n_jobs=10, random_state=None, verbose=0, warm_start=False, class_weight=None)

    if do_grid_search:
        to_be_tuned_parameters = {
                                  'n_estimators':[500, 1000, 2000],
                                  'max_features':['log2', 'auto', None],
                                  'min_samples_split':[2, 4, 8],
                                  'min_samples_leaf': [1, 2],
    
                                  }
        clf = GridSearchCV(clf, to_be_tuned_parameters, cv=5, n_jobs=5, scoring='log_loss')

    #Best parameters set found on development set:
    #()
    #{'max_features': 'log2', 'min_samples_split': 8, 'criterion': 'gini', 'min_samples_leaf': 1}
    
                
    clf = AdaBoostClassifier(base_estimator=clf, n_estimators=200, learning_rate=0.2, algorithm='SAMME.R', random_state=None)
    print(clf)
    clf.fit(X_train, Y_train)
    if do_grid_search:
        print("Best parameters set found on development set:")
        print()
        
        print(clf.best_params_)
        print()
        print("Grid scores on development set:")
        print()
        for params, mean_score, scores in clf.grid_scores_:
            print("%0.3f (+/-%0.03f) for %r"
                  % (mean_score, scores.std() * 2, params))
    else:
        scores = cross_validation.cross_val_score(clf, X_train, Y_train, cv=5, n_jobs=5, scoring='log_loss')
        print scores, np.mean(scores), np.median(scores)
    Y_eval = clf.predict(X_eval)
    Y_prob = clf.predict_proba(X_eval)
    return Y_eval, Y_prob, clf.feature_importances_()

예제 #2

파일 보기

correlation_matrix(df)
#splitiing data in train and test
X = df.iloc[:,:(nVar-1)]
print(X)
Y = df.iloc[:,(nVar-1):]
print(Y)
X_train, X_test,Y_train, Y_test = train_test_split(X,Y, test_size = 0.2, random_state=24) 
print(Y_train)


## Model 1-RandomForest
clf1 = RandomForestClassifier()
clf1.fit(X_train,Y_train)

#feature importance
clf1.feature_importances_()

predict = clf1.predict(X_test)


#cross val score
score1 = np.mean(cross_val_score(clf, X, Y, scoring='accuracy', cv=10))
print(score1)
## Metrics-accuracy
print(accuracy_score(predict,Y_test))

#kappa score
score3 = cohen_kappa_score(Y_test,predict)
print(score3)
#recall score
score2=recall_score(Y_test, predict, average='macro')