Python DatasetManager.encode_data_with_label_all_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dataset_manager

클래스/타입: DatasetManager

메소드/함수: encode_data_with_label_all_data

hotexamples.com에서의 예제들: 2

Python DatasetManager.encode_data_with_label_all_data - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dataset_manager.DatasetManager.encode_data_with_label_all_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DatasetManager(27)

get_datasets(6)

boot(5)

create_dataset(3)

generate_3d_data_for_prefix_length(3)

get_batch(2)

encode_data_with_label_all_data(2)

equalize_vector_length_to_np(2)

generate_3d_data_with_label_all_data(2)

add_array(2)

generate_3d_data(2)

get_dataset(2)

get_max_case_length(1)

get_pos_case_length_quantile(1)

get_dataset_names(1)

generate_3d_data_for_prefix_length_with_label_all_data(1)

get_dataloader(1)

extract_timestamp_features(1)

generate_3d_data_for_prefix_length_with_label(1)

generate_3d_data_for_prefix_length_no_padding(1)

extract_duration_features(1)

encode_data_with_label_all_data_act_res_embedding(1)

encode_data_with_label(1)

encode_data(1)

create_label_vector(1)

create_dataset_with_new_annotations(1)

convert_labels_to_np(1)

calculate_divisors(1)

get_test_by_batch(1)

예제 #1

파일 보기

파일: evaluate_singletask_outcome_all_data.py 프로젝트: irhete/lstm-predictive-monitoring

results_file = os.path.join(
    output_dir, "evaluation_results/results_%s_%s_%s.csv" %
    (cls_method, dataset_name, params))

##### MAIN PART ######

print('Preparing data...')
start = time.time()

dataset_manager = DatasetManager(dataset_name)
data = dataset_manager.read_dataset()
train, test = dataset_manager.split_data(
    data, train_ratio, split=data_split_type
)  # to reproduce results of Tax et al., use 'ordered' instead of 'temporal'

dt_train = dataset_manager.encode_data_with_label_all_data(train)
dt_test = dataset_manager.encode_data_with_label_all_data(test)

if normalize_over == "train":
    dataset_manager.calculate_divisors(dt_train)
elif normalize_over == "all":
    dt_all = dataset_manager.extract_timestamp_features(data)
    dt_all = dataset_manager.extract_duration_features(dt_all)
    dataset_manager.calculate_divisors(dt_all)
else:
    print("unknown normalization mode")

dt_test = dataset_manager.normalize_data(dt_test)

print("Done: %s" % (time.time() - start))

예제 #2

파일 보기

파일: validate.py 프로젝트: irhete/business-process-embeddings

train_ratio = 0.8
val_ratio = 0.2
activation = "sigmoid"
optimizer = "adam"
nb_epoch = 50

dataset_manager = DatasetManager(dataset_name)
data = dataset_manager.read_dataset()
train, _ = dataset_manager.split_data_strict(data,
                                             train_ratio,
                                             split="temporal")
train, val = dataset_manager.split_val(train, val_ratio, split="random")

if embedding_type == "none":
    dt_train = dataset_manager.encode_data_with_label_all_data(train)
    dt_val = dataset_manager.encode_data_with_label_all_data(val)
else:
    dt_train = dataset_manager.encode_data_with_label_all_data_act_res_embedding(
        train,
        embedding_type=embedding_type,
        embedding_dim=embedding_dim,
        scale_model=scale_model)
    dt_val = dataset_manager.encode_data_with_label_all_data_act_res_embedding(
        val,
        embedding_type=embedding_type,
        embedding_dim=embedding_dim,
        scale_model=scale_model)

if "bpic2017" in dataset_name:
    max_len = min(20, dataset_manager.get_pos_case_length_quantile(data, 0.95))