Python TextLoader.read_dataset Exemples

Langage de programmation: Python

Espace de nommage/Pack: utils

Class/Type: TextLoader

Méthode/Fonction: read_dataset

Exemples au hotexamples.com: 4

Python TextLoader.read_dataset - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de utils.TextLoader.read_dataset extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

TextLoader(30)

reset_batch_pointer(30)

next_batch(30)

pointer(7)

read_dataset(3)

cue_batch_pointer_to_epoch_fraction(2)

get_batch(2)

next_batch_test(2)

reset_batch_pointers(1)

sentence_to_token_id(1)

read_data(1)

prepare_data(1)

shuff(1)

pick_bucket(1)

parse_input(1)

next_epoch(1)

next_batch_tr(1)

load_data(1)

build_vocab(1)

iterbatches(1)

init_vocabulary(1)

init_train_bucket(1)

get_words_id(1)

get_words_by_id(1)

get_first_batch_as_valid(1)

get_embeddings(1)

get_data_for_feeder(1)

compose_output(1)

close(1)

clean_str(1)

chars(1)

tensor(1)

Méthodes fréquemment utilisées

TextLoader (30)

reset_batch_pointer (30)

next_batch (30)

pointer (7)

read_dataset (3)

cue_batch_pointer_to_epoch_fraction (2)

get_batch (2)

next_batch_test (2)

reset_batch_pointers (1)

sentence_to_token_id (1)

Méthodes fréquemment utilisées

read_data (1)

prepare_data (1)

shuff (1)

pick_bucket (1)

parse_input (1)

next_epoch (1)

next_batch_tr (1)

load_data (1)

build_vocab (1)

iterbatches (1)

init_vocabulary (1)

init_train_bucket (1)

get_words_id (1)

get_words_by_id (1)

get_first_batch_as_valid (1)

get_embeddings (1)

get_data_for_feeder (1)

compose_output (1)

close (1)

clean_str (1)

Méthodes fréquemment utilisées

init_vocabulary (1)

init_train_bucket (1)

get_words_id (1)

get_words_by_id (1)

get_first_batch_as_valid (1)

get_embeddings (1)

get_data_for_feeder (1)

compose_output (1)

close (1)

clean_str (1)

chars (1)

tensor (1)

Méthodes fréquemment utilisées

chars (1)

tensor (1)

Exemple #1

0

Afficher le fichier

def test(test_args): start = time.time() with open(os.path.join(test_args.save_dir, 'config.pkl')) as f: args = cPickle.load(f) data_loader = TextLoader(args, train=False) test_data = data_loader.read_dataset(test_args.test_file) args.word_vocab_size = data_loader.word_vocab_size print "Word vocab size: " + str(data_loader.word_vocab_size) + "\n" # Model lm_model = WordLM print "Begin testing..." # If using gpu: # gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.9) # gpu_config = tf.ConfigProto(log_device_placement=False, gpu_options=gpu_options) # add parameters to the tf session -> tf.Session(config=gpu_config) with tf.Graph().as_default(), tf.Session() as sess: initializer = tf.random_uniform_initializer(-args.init_scale, args.init_scale) with tf.variable_scope("model", reuse=None, initializer=initializer): mtest = lm_model(args, is_training=False, is_testing=True) # save only the last model saver = tf.train.Saver(tf.all_variables()) tf.initialize_all_variables().run() ckpt = tf.train.get_checkpoint_state(args.save_dir) if ckpt and ckpt.model_checkpoint_path: saver.restore(sess, ckpt.model_checkpoint_path) test_perplexity = run_epoch(sess, mtest, test_data, data_loader, tf.no_op()) print("Test Perplexity: %.3f" % test_perplexity) print("Test time: %.0f" % (time.time() - start))

Exemple #2

0

Afficher le fichier

Fichier : test.py Projet : agora-at-uoe/tf-tutorial

def test(test_args): start = time.time() with open(os.path.join(test_args.save_dir, 'config.pkl')) as f: args = cPickle.load(f) data_loader = TextLoader(args, train=False) test_data = data_loader.read_dataset(test_args.test_file) args.word_vocab_size = data_loader.word_vocab_size print "Word vocab size: " + str(data_loader.word_vocab_size) + "\n" # Model lm_model = WordLM print "Begin testing..." # If using gpu: # gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.9) # gpu_config = tf.ConfigProto(log_device_placement=False, gpu_options=gpu_options) # add parameters to the tf session -> tf.Session(config=gpu_config) with tf.Graph().as_default(), tf.Session() as sess: initializer = tf.random_uniform_initializer(-args.init_scale, args.init_scale) with tf.variable_scope("model", reuse=None, initializer=initializer): mtest = lm_model(args, is_training=False, is_testing=True) # save only the last model saver = tf.train.Saver(tf.all_variables()) tf.initialize_all_variables().run() ckpt = tf.train.get_checkpoint_state(args.save_dir) if ckpt and ckpt.model_checkpoint_path: saver.restore(sess, ckpt.model_checkpoint_path) test_perplexity = run_epoch(sess, mtest, test_data, data_loader, tf.no_op()) print("Test Perplexity: %.3f" % test_perplexity) print("Test time: %.0f" % (time.time() - start))

Exemple #3

0

Afficher le fichier

Fichier : test.py Projet : claravania/subword_lm_pytorch

def test(test_args): start = time.time() with open(os.path.join(test_args.save_dir, 'config.pkl'), 'rb') as f: args = pickle.load(f) args.save_dir = test_args.save_dir data_loader = TextLoader(args, train=False) test_data = data_loader.read_dataset(test_args.test_file) print(args.save_dir) print("Unit: " + args.unit) print("Composition: " + args.composition) args.word_vocab_size = data_loader.word_vocab_size if args.unit != "word": args.subword_vocab_size = data_loader.subword_vocab_size # Statistics of words print("Word vocab size: " + str(data_loader.word_vocab_size)) # Statistics of sub units if args.unit != "word": print("Subword vocab size: " + str(data_loader.subword_vocab_size)) if args.composition == "bi-lstm": if args.unit == "char": args.bilstm_num_steps = data_loader.max_word_len print("Max word length:", data_loader.max_word_len) elif args.unit == "char-ngram": args.bilstm_num_steps = data_loader.max_ngram_per_word print("Max ngrams per word:", data_loader.max_ngram_per_word) elif args.unit == "morpheme" or args.unit == "oracle": args.bilstm_num_steps = data_loader.max_morph_per_word print("Max morphemes per word", data_loader.max_morph_per_word) if args.unit == "word": lm_model = WordModel elif args.composition == "addition": lm_model = AdditiveModel elif args.composition == "bi-lstm": lm_model = BiLSTMModel else: sys.exit("Unknown unit or composition.") print("Begin testing...") mtest = lm_model(args, is_testing=True) if args.use_cuda: mtest = mtest.cuda() # get the last saved model model_path, _ = get_last_model_path(args.save_dir) saved_model = torch.load(model_path) mtest.load_state_dict(saved_model['state_dict']) test_perplexity = run_epoch(mtest, test_data, data_loader, eval=True) print("Test Perplexity: %.3f" % test_perplexity) print("Test time: %.0f\n" % (time.time() - start)) print("\n")

Exemple #4

0

Afficher le fichier

def test(test_args): start = time.time() with open(os.path.join(test_args.save_dir, 'config.pkl'), 'rb') as f: args = pickle.load(f) args.save_dir = test_args.save_dir data_loader = TextLoader(args, train=False) test_data = data_loader.read_dataset(test_args.test_file) print(args.save_dir) print("Unit: " + args.unit) print("Composition: " + args.composition) args.word_vocab_size = data_loader.word_vocab_size if args.unit != "word": args.subword_vocab_size = data_loader.subword_vocab_size # Statistics of words print("Word vocab size: " + str(data_loader.word_vocab_size)) # Statistics of sub units if args.unit != "word": print("Subword vocab size: " + str(data_loader.subword_vocab_size)) if args.composition == "bi-lstm": if args.unit == "char": args.bilstm_num_steps = data_loader.max_word_len print("Max word length:", data_loader.max_word_len) elif args.unit == "char-ngram": args.bilstm_num_steps = data_loader.max_ngram_per_word print("Max ngrams per word:", data_loader.max_ngram_per_word) elif args.unit == "morpheme" or args.unit == "oracle": args.bilstm_num_steps = data_loader.max_morph_per_word print("Max morphemes per word", data_loader.max_morph_per_word) if args.unit == "word": lm_model = WordModel elif args.composition == "addition": lm_model = AdditiveModel elif args.composition == "bi-lstm": lm_model = BiLSTMModel else: sys.exit("Unknown unit or composition.") print("Begin testing...") with tf.Graph().as_default(), tf.Session() as sess: with tf.variable_scope("model"): mtest = lm_model(args, is_training=False, is_testing=True) # save only the last model saver = tf.train.Saver(tf.all_variables(), max_to_keep=1) tf.initialize_all_variables().run() ckpt = tf.train.get_checkpoint_state(args.save_dir) if ckpt and ckpt.model_checkpoint_path: saver.restore(sess, ckpt.model_checkpoint_path) test_perplexity = run_epoch(sess, mtest, test_data, data_loader, tf.no_op()) print("Test Perplexity: %.3f" % test_perplexity) print("Test time: %.0f\n" % (time.time() - start)) print("\n")