Python Environment.filename_model_texts Examples

Programming Language: Python

Namespace/Package Name: common

Class/Type: Environment

Method/Function: filename_model_texts

Examples at hotexamples.com: 2

Python Environment.filename_model_texts - 2 examples found. These are the top rated real world Python examples of common.Environment.filename_model_texts extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Environment(30)

debug(20)

job_time(10)

bgm_columns_list(4)

filename_results_csv(3)

filename_model_tree(3)

filename_corpus_csv(3)

filename_authors_csv(3)

filename_stat_test_csv(2)

filename_dict_csv(2)

filename_grammemes_csv(2)

filename_model_texts(2)

filename_vocabulary_csv(2)

filename_tokenz_csv(2)

filename_corpus_xml(2)

filename_corpus_txt(1)

list_rus_letters(1)

filename_xtrain_csv(1)

filename_vocabulary_patch_csv(1)

filename_texts_csv(1)

filename_test_err_csv(1)

filename_scaler(1)

filename_stat_pos_tokenz_csv(1)

filename_stat_bigram_letters_csv(1)

filename_predict_csv(1)

add(1)

filename_model_texts_pca(1)

filename_mlcache_csv(1)

filename_grammemes_xml(1)

filename_global_report_html(1)

filename_dict_xml(1)

path_templates(1)

Example #1

Show file

File: analyzer.py Project: shashmaxus/mlivos

    def model_train(self):
        env = Environment()
        data = self.stat()
        t_start = timer()
        y, X = self.model_prepare_data(data)

        seed = 241
        scoring = 'accuracy'
        n_splits = 4
        frac_test_size = 0.25

        #Cross-validation
        kf = KFold(n_splits=n_splits, shuffle=True, random_state=seed)
        #clf = DecisionTreeClassifier(criterion='gini', random_state=seed)
        #clf = GradientBoostingClassifier(n_estimators=50)
        model = xgb.XGBClassifier(n_estimators=400,
                                  max_depth=24,
                                  colsample=1,
                                  subsample=1,
                                  seed=seed)
        cv_scores = cross_val_score(model, X, y, cv=kf)

        #eval
        X_train, X_test, y_train, y_test = train_test_split(
            X, y, test_size=frac_test_size, random_state=seed)
        eval_set = [(X_train, y_train), (X_test, y_test)]
        #print(eval_set)
        f_eval = 'merror'
        # f_eval = 'mlogloss'
        model.fit(X_train,
                  y_train,
                  eval_metric=f_eval,
                  eval_set=eval_set,
                  verbose=False,
                  early_stopping_rounds=10)
        ev_scores = model.evals_result()

        cv_mean = np.array(cv_scores.mean())
        #ev_mean = np.array(ev_scores['validation_0']['mlogloss']).mean()
        ev_mean = np.array(ev_scores['validation_0'][f_eval]).mean()

        #Посмотрим важность признаков в модели
        #print(model.feature_importances_)
        xgb.plot_importance(model)
        #plt.bar(range(len(model.feature_importances_)), model.feature_importances_)
        plt.show()

        #Обучаем модель на всех данных
        model.fit(X, y, verbose=False)
        #Сохраняем модель на диск
        pickle.dump(model, open(env.filename_model_texts(), 'wb'))

        #print('CV', cv_scores, 'EV', ev_scores)
        print('Cross-validation: mean', cv_mean, 'eval_set mean', ev_mean)
        return model

Example #2

Show file

File: analyzer.py Project: shashmaxus/mlivos

 def model_predict(self, df, b_retrain=False):
     env = Environment()
     y, X = self.model_prepare_data(df, mode='test')
     if b_retrain:
         model = self.model_train(
         )  #Если хотим для кажжого теста вновь тренировать модель
     else:
         #Загружаем ранее тренированную модель с диска
         model = pickle.load(open(env.filename_model_texts(), 'rb'))
     #Предсказываем
     y = model.predict(X)
     return y