Python BlackOakDataSetUppercase.get_number_dirty_columns 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ml.datasets.blackOak.BlackOakDataSetUppercase

메소드/함수: get_number_dirty_columns

hotexamples.com에서의 예제들: 3

Python BlackOakDataSetUppercase.get_number_dirty_columns - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ml.datasets.blackOak.BlackOakDataSetUppercase.BlackOakDataSetUppercase.get_number_dirty_columns에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

BlackOakDataSetUppercase(16)

get_number_dirty_columns(3)

예제 #1

파일 보기

import numpy as np

from ml.datasets.blackOak.BlackOakDataSetUppercase import BlackOakDataSetUppercase
from ml.tools.dboost.TestDBoost import test_multiple_sizes_mixture

data = BlackOakDataSetUppercase()
'''
steps = 100
sizes = [10, 20, 30, 40, 50]
N = 5
'''

steps = 100
N = 10
labels = 378

nr_rows = int(float(labels) / data.shape[1])
sizes = np.array([50, 100, 150, 200], dtype=float)  # in cells
#sizes = np.array([200], dtype=float) # in cells

print sizes
dirty_column_fraction = data.get_number_dirty_columns() / float(data.shape[1])
sizes /= dirty_column_fraction
sizes /= float(data.shape[1])
print sizes
row_sizes = np.array(sizes, dtype=int)  # in rows

log_file = "/home/felix/ExampleDrivenErrorDetection/log/dBoost/BlackOakUppercase_mix_new.txt"

test_multiple_sizes_mixture(data, steps, N, row_sizes, log_file)

예제 #2

파일 보기

    print datasets[i]

N_datasets = 7
'''




log_folder = "unique_batch" #"unique"

#dataset = HospitalHoloClean() #BlackOakDataSetUppercase()
#future_steps = 60 #BlackOak = 7, Flights = 9
dataset = BlackOakDataSetUppercase()
future_steps = 7 #BlackOak = 7, Flights = 9

n = dataset.get_number_dirty_columns()

best_sum_total_f = {}
best_col_seq = {}



for d in range(10):
    file_path = "/home/felix/ExampleDrivenErrorDetection/progress_log_data/" + log_folder + "/log_progress_"+ dataset.name +"_" + str(d)  +".csv"
    x, fp, fn, tp = read_csv1(file_path, None)

    estimated_scores = get_estimated_tp_fp_fn(x, n, dataset,feature_names, which_features_to_use)

    print "train: " + str(x.shape[0])
    print "features: " + str(all_features)
    assert x.shape[1] == all_features

예제 #3

파일 보기

파일: FPotentialPredictMulti.py 프로젝트: yuancz/ExampleDrivenErrorDetection

for key, value in sorted_x:
    labels.append(key)
    score.append(value)
    t += 1
    if t == 25:
        break

if enable_plotting:
    ind = np.arange(len(score))
    plt.barh(ind, score, align='center', alpha=0.5)
    plt.yticks(ind, labels)
    plt.show()

y_pred = final.predict(mat)

nr_columns = model_for_dataset.get_number_dirty_columns()

N_datasets_test = 7
X_test = []
y_test = []
pred_test = []

for ndata in range(N_datasets_test):
    file_path_test = "/home/felix/ExampleDrivenErrorDetection/progress_log_data/7/log_progress_" + model_for_dataset.name + "_" + str(
        ndata) + ".csv"

    t_x, t_y = read_csv1(file_path_test, None)

    print t_x.shape

    endfnew = np.zeros(nr_columns)