Python DataFormatter.shuffle_scikit_data_target 예제들

프로그래밍 언어: Python

클래스/타입: DataFormatter

메소드/함수: shuffle_scikit_data_target

hotexamples.com에서의 예제들: 4

Python DataFormatter.shuffle_scikit_data_target - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 DataFormatter.shuffle_scikit_data_target 패키지로부터 commcare-hq에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

get_scikit_data_and_target(6)

get_expression_scikit_data_target_for_drug(5)

get_expression_frame_and_ic50_series_for_drug(4)

shuffle_scikit_data_target(4)

DataFormatter(3)

get_expression_frame_with_features(2)

formatData(2)

get_pval_top_n_features(2)

_format_array_v2(2)

get_normalized_full_expression_identifiers_and_data(2)

get_cell_line_expression_frame(2)

get_cell_line_and_patient_expression_data_target_for_drug(2)

make_recurrent(1)

remove_global_output_columns(1)

recurrent_regression_to_classification(1)

partition(1)

normalize_string(1)

normalize_expression_frame(1)

get_scikit_data(1)

get_alpha_vantage_data(1)

formatFile(1)

get_patients_expression_frame(1)

getFormattedData(1)

get_features_below_pval_threshold(1)

get_cell_line_and_patient_expression_data_target_top_features_for_drug(1)

get_cell_line_and_patient_expression_gene_intersection(1)

generate_distance_sums_for_individual_fish(1)

예제 #1

파일 보기

파일: Classification.py 프로젝트: joewledger/Cell-Line-Classification

 def get_model_accuracy_filter_feature_size(self,expression_file, ic50_file,feature_size,num_permutations,drug):
     scikit_data,scikit_target = dfm.get_expression_scikit_data_target_for_drug(expression_file,ic50_file,drug,normalized=True,trimmed=True,threshold=None)
     for i in range(0,num_permutations):
         try:
             shuffled_data,shuffled_target = dfm.shuffle_scikit_data_target(scikit_data,scikit_target)
             accuracy = cv.cross_val_score_filter_feature_selection(self.model,cv.trim_X_num_features,feature_size,shuffled_data,shuffled_target,cv=5)
             yield accuracy.mean()
         except:
             yield 0.0

예제 #2

파일 보기

파일: Classification.py 프로젝트: joewledger/Cell-Line-Classification

    def get_model_accuracy_RFE(self,expression_file,ic50_file,target_features,num_permutations,drug):

        scikit_data,scikit_target = dfm.get_expression_scikit_data_target_for_drug(expression_file,ic50_file,drug,normalized=True,trimmed=True,threshold=None)
        step_length = int(len(scikit_data.tolist()[0]) / 100) + 1
        for i in xrange(0,num_permutations):
            try:
                shuffled_data,shuffled_target = dfm.shuffle_scikit_data_target(scikit_data,scikit_target)
                selector = RFE(self.model,target_features,step=step_length)
                yield cross_val_score(selector,shuffled_data,shuffled_target,cv=5).mean()
            except:
                yield 0.0

예제 #3

파일 보기

파일: Classification.py 프로젝트: joewledger/Cell-Line-Classification

 def get_cross_validation_time(self,expression_file, ic50_file,feature_size,num_permutations,drug):
     scikit_data,scikit_target = dfm.get_expression_scikit_data_target_for_drug(expression_file,ic50_file,drug,normalized=True,trimmed=True,threshold=None)
     for i in range(0,num_permutations):
         try:
             shuffled_data,shuffled_target = dfm.shuffle_scikit_data_target(scikit_data,scikit_target)
             start_time = datetime.datetime.now()
             cv.cross_val_score_filter_feature_selection(self.model,cv.trim_X_num_features,feature_size,shuffled_data,shuffled_target,cv=5)
             end_time = datetime.datetime.now()
             yield float((end_time - start_time).microseconds) / 100000
         except:
             yield 0.0

예제 #4

파일 보기

파일: NEAT_Metrics.py 프로젝트: joewledger/Cell-Line-Classification

def acc_and_run(g,scikit_data,scikit_target,num_features,num_permutations):
    results = []

    for perm in xrange(0,num_permutations):
        try:
            start_time = datetime.datetime.now()
            model = n.NeatClassifier(max_generations=g)
            shuffled_data,shuffled_target = dfm.shuffle_scikit_data_target(scikit_data,scikit_target)
            acc = cv.cross_val_score_filter_feature_selection(model,cv.trim_X_num_features,num_features,shuffled_data,shuffled_target,cv=5)
            end_time = datetime.datetime.now()
            results.append((acc.mean(),float((end_time - start_time).microseconds) / 100000))
        except:
            results.append((0.0, 1000.0))
            print(sys.exc_info()[0])
    return results