Python get_columns_in_df 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: blue.pandas_utils

메소드/함수: get_columns_in_df

hotexamples.com에서의 예제들: 3

Python get_columns_in_df - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 blue.pandas_utils.get_columns_in_df에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: evaluation.py 프로젝트: ShallowLearning/flavourml

 def _check_agreements(self, model):
     self.check_agreement = get_columns_in_df(self._check_agreement, self.flist.predictors)
     agreement_prob = model.predict_proba(self.check_agreement.values)[:,1]
     ks = compute_ks(
         agreement_prob[self._check_agreement['signal'].values == 0],
         agreement_prob[self._check_agreement['signal'].values == 1],
         self._check_agreement[self._check_agreement['signal'] == 0]['weight'].values,
         self._check_agreement[self._check_agreement['signal'] == 1]['weight'].values)
     return ks

예제 #2

파일 보기

파일: evaluation.py 프로젝트: ShallowLearning/flavourml

 def _check_correlations(self, model):
     self.check_correlation = get_columns_in_df(self._check_correlation, self.flist.predictors)
     correlation_probs = model.predict_proba(self.check_correlation.values)[:,1]
     cvm = compute_cvm(correlation_probs, self._check_correlation['mass'])
     return cvm

예제 #3

파일 보기

파일: run.py 프로젝트: ShallowLearning/flavourml

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from blue.featurelist import FeatureList
from blue.pandas_utils import get_columns_in_df
from blue.estimators import HyperoptEstimator

from evaluation import roc_auc_truncated

train_file = './data/training.csv'
test_file = './data/test.csv'
flist = FeatureList(train_file, spec='features.yml', derived_list=None)

df_train = pd.read_csv(train_file, index_col='id')
df_train = get_columns_in_df(df_train, flist.universe)

df_test = pd.read_csv(test_file)
df_test = get_columns_in_df(df_test, flist.predictors)

hpest = HyperoptEstimator(RandomForestClassifier, max_evals=5, n_jobs=3, metric=lambda x,y : - roc_auc_truncated(x,y))
hpest.fit(df_train[flist.predictors].values, df_train[flist.target].values)