Python LoadData.transform Exemples

Langage de programmation: Python

Espace de nommage/Pack: load_data

Class/Type: LoadData

Méthode/Fonction: transform

Exemples au hotexamples.com: 1

Python LoadData.transform - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de load_data.LoadData.transform extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

LoadData(30)

get_data(6)

read_data(5)

get_labels(5)

query_db(4)

load(4)

load_data(4)

load_processed_data(2)

reduce_mem_usage(2)

main(2)

make_dataset(2)

close(2)

query_and_save(2)

run_loadData(2)

build_vocab(1)

save_data(1)

load_train_data(1)

pad_data(1)

open_text(1)

next(1)

negative_sample(1)

transform(1)

update_negative_sample(1)

load_txt(1)

fetch_data(1)

load_several_html(1)

load_test_data(1)

get_temp_web(1)

getInputValues(1)

get_all_frames(1)

extrac_keywords(1)

data_split(1)

get_last_n_frames(1)

get_segments(1)

get_test_batch(1)

fit_transform(1)

get_train_batch(1)

items(1)

iterate_root_web(1)

creat_id_sentences(1)

loadNSplit(1)

_load_data(1)

load_html(1)

values(1)

Méthodes fréquemment utilisées

LoadData (30)

get_data (6)

read_data (5)

get_labels (5)

query_db (4)

load (4)

load_data (4)

load_processed_data (2)

reduce_mem_usage (2)

main (2)

Méthodes fréquemment utilisées

make_dataset (2)

close (2)

query_and_save (2)

run_loadData (2)

build_vocab (1)

save_data (1)

load_train_data (1)

pad_data (1)

open_text (1)

next (1)

negative_sample (1)

transform (1)

update_negative_sample (1)

load_txt (1)

fetch_data (1)

load_several_html (1)

load_test_data (1)

get_temp_web (1)

getInputValues (1)

get_all_frames (1)

Méthodes fréquemment utilisées

negative_sample (1)

transform (1)

update_negative_sample (1)

load_txt (1)

fetch_data (1)

load_several_html (1)

load_test_data (1)

get_temp_web (1)

getInputValues (1)

get_all_frames (1)

extrac_keywords (1)

data_split (1)

get_last_n_frames (1)

get_segments (1)

get_test_batch (1)

fit_transform (1)

get_train_batch (1)

items (1)

iterate_root_web (1)

creat_id_sentences (1)

loadNSplit (1)

_load_data (1)

load_html (1)

values (1)

Méthodes fréquemment utilisées

extrac_keywords (1)

data_split (1)

get_last_n_frames (1)

get_segments (1)

get_test_batch (1)

fit_transform (1)

get_train_batch (1)

items (1)

iterate_root_web (1)

creat_id_sentences (1)

loadNSplit (1)

_load_data (1)

load_html (1)

values (1)

Exemple #1

0

Afficher le fichier

def main(argv): argv = docopt.docopt(__doc__) num_epochs = argv['--num_epochs'] mini_batch_size = argv['--mini_batch_size'] val_mini_batch_size = 64 num_classes = argv['--num_classes'] lstm_hidden_state_size = argv['--lstm_hidden_state'] random_seed = argv['--random_seed'] np.random.seed(random_seed) random.seed(random_seed) def read_ids(filename): ids = [] with open(filename, 'r') as fp: for row in fp: ids.append(row.strip()) return ids train_ids = read_ids(argv['--train_ids']) val_ids = read_ids(argv['--dev_ids']) test_ids = read_ids(argv['--test_ids']) ld = LoadData(argv['--word2vec']) train_pairs, train_e1, train_e2, train_y, train_ids, _, _ = ld.fit_transform( argv['--dataset'], train_ids) dev_pairs, dev_e1, dev_e2, dev_y, val_ids, dev_e1_ids, dev_e2_ids = ld.transform( argv['--dataset'], val_ids) test_pairs, test_e1, test_e2, test_y, test_ids, e1_ids, e2_ids = ld.transform( argv['--dataset'], test_ids) idxs = list(range(len(train_pairs))) dev_idxs = list(range(len(dev_pairs))) test_idxs = list(range(len(test_pairs))) last_loss = None avg_loss = [] avg_f1 = [] check_preds = None mod = BiLSTM(ld.embs, ld.pos, nc=num_classes, nh=lstm_hidden_state_size, de=ld.embs.shape[1]) best_dev_f1 = 0 for epoch in range(1, num_epochs + 1): mean_loss = [] random.shuffle(idxs) for start, end in zip( range(0, len(idxs), mini_batch_size), range(mini_batch_size, len(idxs) + mini_batch_size, mini_batch_size)): idxs_sample = idxs[start:end] if len(idxs_sample) < mini_batch_size: continue batch_labels = np.array(train_y[idxs_sample], dtype='int32') tpairs = ld.pad_data([train_pairs[i] for i in idxs_sample]) te1 = ld.pad_data([train_e1[i] for i in idxs_sample]) te2 = ld.pad_data([train_e2[i] for i in idxs_sample]) cost = mod.train_batch(tpairs, te1, te2, train_y[idxs_sample].astype('int32'), np.float32(0.), np.array(negs).astype('int32')) mean_loss.append(cost) print("EPOCH: %d loss: %.4f train_loss: %.4f" % (epoch, cost, np.mean(mean_loss))) sys.stdout.flush() all_dev_preds = [] scores = [] for start, end in zip( range(0, len(dev_idxs), val_mini_batch_size), range(val_mini_batch_size, len(dev_idxs) + val_mini_batch_size, val_mini_batch_size)): if len(dev_idxs[start:end]) == 0: continue vpairs = ld.pad_data([dev_pairs[i] for i in dev_idxs[start:end]]) ve1 = ld.pad_data([dev_e1[i] for i in dev_idxs[start:end]]) ve2 = ld.pad_data([dev_e2[i] for i in dev_idxs[start:end]]) preds = mod.predict_proba(vpairs, ve1, ve2, np.float32(1.)) for x in preds: if x > 0.5: all_dev_preds.append(1) else: all_dev_preds.append(0) dev_f1 = f1_score(dev_y, all_dev_preds, average='binary') print("EPOCH: %d train_loss: %.4f dev_f1: %.4f" % (epoch, np.mean(mean_loss), dev_f1)) sys.stdout.flush() if dev_f1 > best_dev_f1: with open(argv['--model'], 'w') as fp: pickle.dump({ 'model_params': mod.__getstate__(), 'token': ld }, fp, pickle.HIGHEST_PROTOCOL) best_dev_f1 = dev_f1 all_test_preds = [] scores = [] for start, end in zip( range(0, len(test_idxs), val_mini_batch_size), range(val_mini_batch_size, len(test_idxs) + val_mini_batch_size, val_mini_batch_size)): if len(test_idxs[start:end]) == 0: continue tpairs = ld.pad_data( [test_pairs[i] for i in test_idxs[start:end]]) te1 = ld.pad_data([test_e1[i] for i in test_idxs[start:end]]) te2 = ld.pad_data([test_e2[i] for i in test_idxs[start:end]]) preds = mod.predict_proba(tpairs, te1, te2, np.float32(1.)) for x in preds: if x > 0.5: all_test_preds.append(1) else: all_test_preds.append(0) test_f1 = f1_score(test_y, all_test_preds, average='binary') print("EPOCH: %d train_loss: %.4f dev_f1: %.4f test_f1: %.4f" % (epoch, np.mean(mean_loss), dev_f1, test_f1)) sys.stdout.flush()