Python Evaluator.build_models 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: Evaluator

클래스/타입: Evaluator

메소드/함수: build_models

hotexamples.com에서의 예제들: 1

Python Evaluator.build_models - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 Evaluator.Evaluator.build_models에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

AddAlgorithm(30)

Evaluator(30)

evaluate(30)

SampleTopNRecs(13)

get_URM_train(12)

Evaluate(12)

eval(10)

getAccuracy(5)

getPRF(5)

GetPascalVOCMetrics(3)

calculate_ri(2)

SetNetworkGraph(2)

calculate_precision_recall(2)

build_dataset(2)

SetSimulationContext(2)

evaluate_closed_form(2)

calculate_purity(2)

SetNetworkMesh(2)

SetAlgorithm(2)

ExpressionCache(2)

get_calls(2)

get_codelines(2)

get_function_tags(2)

evaluate_samples_binned(1)

get_macro_f1(1)

evaluate_nn_for_image(1)

evaluate_performance(1)

evaluate_place(1)

evaluate_samples(1)

get_label_by_image_name(1)

evaluate_string(1)

evolve_generation(1)

get_AP(1)

get_conditional_jmps(1)

executeSource(1)

getConfusionMetrics(1)

get_MRR(1)

get_MAP(1)

evaluate_embeddings(1)

decode_schedules_to_simulation_schedule(1)

evaluateNeji(1)

ROUGE2(1)

Class_IOU(1)

GenerateTopNRecs(1)

GetRecomendationMovie(1)

GetTopNRecs(1)

Mean_Intersection_over_Union(1)

Picker(1)

Pixel_Accuracy(1)

Pixel_Accuracy_Class(1)

예제 #1

파일 보기

파일: Main.py 프로젝트: MichaKh/Titanic

def main():
    data_train_file_path = 'Data/train.csv'
    data_test_file_path = 'Data/test_with_label.csv'
    data_types = {
        'Survived': 'Categorical',
        'Pclass': 'Categorical',
        'Name_Affiliation': 'Categorical',
        'Last_Name': 'Text',
        'First_Name': 'Text',
        'Sex': 'Categorical',
        'Age': 'Numerical',
        'SibSp': 'Numerical',
        'Parch': 'Numerical',
        'Ticket_Code': 'Categorical',
        'Ticket_Number': 'Numerical',
        'Fare': 'Numerical',
        'Cabin_Floor': 'Categorical',
        'Cabin_Rooms': 'Text',
        'Embarked': 'Categorical',
        'Family_Members': 'Numerical',
        'is_Traveling_Alone': 'Categorical',
        'Fare_Per_Passenger': 'Categorical',
        'is_Female_with_Children': 'Categorical'
    }
    print('Loading train data...')
    train_data_df = DataPreProcessor.load_data(data_train_file_path)
    print('Loading test data...')
    test_data_df = DataPreProcessor.load_data(data_test_file_path)

    print('Cleaning and transforming train data...')
    cleaned_train_data_df = DataPreProcessor.clean_data(
        train_data_df, data_types)
    print('Cleaning and transforming test data...')
    cleaned_test_data_df = DataPreProcessor.clean_data(test_data_df,
                                                       data_types)

    print('Saving cleaned train data to file...')
    cleaned_train_data_df.to_csv("clean_train.csv", index=False)
    print('Saving cleaned test data to file...')
    cleaned_test_data_df.to_csv("clean_test.csv", index=False)

    eval_classifiers = {
        'TreeClassifier':
        DecisionTreeClassifier(criterion="gini",
                               splitter="best",
                               max_depth=4,
                               random_state=42),
        'AdaBoost':
        AdaBoostClassifier(base_estimator=DecisionTreeClassifier(),
                           random_state=42),
        'LogisticRegression':
        LogisticRegression(penalty='l1', max_iter=10000, random_state=42),
        'RandomForestClassifier':
        RandomForestClassifier(n_estimators=2000,
                               max_depth=4,
                               min_samples_split=10,
                               random_state=42,
                               class_weight={
                                   0: 0.80,
                                   1: 0.20
                               }),
        'GBTrees':
        GradientBoostingClassifier(max_depth=4,
                                   learning_rate=0.1,
                                   n_estimators=2000,
                                   random_state=42,
                                   min_samples_split=10),
        'xgboost':
        XGBClassifier(max_depth=4,
                      n_estimators=1000,
                      random_state=42,
                      learning_rate=0.1,
                      min_samples_split=10),
        'KNN':
        KNeighborsClassifier(n_neighbors=3, p=2),
        'SVM':
        SVC(gamma='auto', tol=1e-3, C=1.5, random_state=42),
        'GBC':
        GradientBoostingClassifier(n_estimators=1000,
                                   max_depth=4,
                                   learning_rate=0.1)
    }

    eval_classifiers_params_grid = {
        'TreeClassifier': {
            'max_depth': [4, 5, 6]
        },
        'AdaBoost': {
            'n_estimators': [100, 200, 500, 1000, 2000],
            'learning_rate': [0.2, 0.1, 0.05, 0.01]
        },
        'LogisticRegression': {
            'penalty': ['l1', 'l2']
        },
        'RandomForestClassifier': {
            'n_estimators': [100, 200, 500, 1000, 2000],
            'max_depth': [4, 5, 6],
            'max_features': [0.8, 0.5, 0.2, 0.1]
        },
        'GBTrees': {
            'n_estimators': [100, 500, 1000, 2000],
            'max_depth': [4, 5, 6],
            'max_features': [0.8, 0.5, 0.2, 0.1],
            'learning_rate': [0.2, 0.1, 0.05, 0.01]
        },
        'xgboost': {
            'n_estimators': [100, 500, 1000, 2000],
            'max_depth': [4, 5, 6],
            'max_features': [0.8, 0.5, 0.2, 0.1],
            'learning_rate': [0.2, 0.1, 0.05, 0.01]
        },
        'KNN': {
            'n_neighbors': [2, 3, 4, 5]
        },
        'SVM': {
            'gamma': [0.001, 0.01, 0.1, 1],
            'C': [1, 10, 50, 100, 200]
        },
        'GBC': {
            'n_estimators': [100, 500, 1000, 2000],
            'max_depth': [4, 5, 6, 8],
            'max_features': [0.8, 0.5, 0.2, 0.1],
            'learning_rate': [0.2, 0.1, 0.05, 0.01]
        }
    }

    # features_cols = ['Pclass', 'Sex', 'Age_Intevals', 'Family_Members', 'Fare_Per_Passenger', 'Embarked', 'Name_Affiliation', 'Ticket_Code', 'Cabin_Floor']
    # features_cols = ['Pclass', 'Sex', 'Age_Intevals', 'is_Traveling_Alone', 'Fare_Per_Passenger', 'Embarked', 'Name_Affiliation', 'Cabin_Floor']
    features_cols = [
        'Pclass', 'Sex', 'Age_Intervals', 'Name_Affiliation', 'Cabin_Floor',
        'is_Female_with_Children'
    ]
    one_hot_encoding_features = ['Name_Affiliation', 'Cabin_Floor', 'Pclass']
    train_X, train_y = prepare_data(
        cleaned_train_data_df,
        class_col='Survived',
        features_cols=features_cols,
        one_hot_encoding_features=one_hot_encoding_features)
    test_X, test_y = prepare_data(
        cleaned_test_data_df,
        class_col='Survived',
        features_cols=features_cols,
        one_hot_encoding_features=one_hot_encoding_features)
    evaluator = Evaluator(train_X, train_y, test_X, test_y, eval_classifiers,
                          eval_classifiers_params_grid)
    # evaluator.select_features(selection_clf=ExtraTreesClassifier(n_estimators=1000, max_depth=4, random_state=42))

    all_predictions, final_prediction = evaluator.build_models(
        grid_search=False)
    evaluation_df = evaluator.save_predictions_to_df(all_predictions,
                                                     final_prediction)
    submission_df = evaluator.save_predictions_for_submission(evaluation_df)
    evaluation_df.to_csv("test_evaluation_results.csv", index=False)
    submission_df.to_csv("test_submission.csv", index=False)
    accuracy = evaluator.evaluate_performance(test_y,
                                              final_prediction,
                                              performance_metric='accuracy')
    print('Accuracy for ensemble models {} is: {}'.format(
        eval_classifiers.keys(), accuracy))