Python Dataset.create_instances Exemples

Langage de programmation: Python

Espace de nommage/Pack: data_utils

Class/Type: Dataset

Méthode/Fonction: create_instances

Exemples au hotexamples.com: 2

Python Dataset.create_instances - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de data_utils.Dataset.create_instances extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Dataset(30)

build(4)

save(3)

create_instances(2)

preprocess(1)

update_X(1)

train_epoch(1)

to_sent_numpy(1)

to_bow_numpy(1)

test_epoch(1)

store_pivots(1)

set_seq_len(1)

set_data_dir(1)

set_batch_size(1)

get_word2idx(1)

join(1)

GenerateBatches(1)

get_tag2idx(1)

get_prec_recl(1)

get_nwords(1)

get_ntags(1)

get_batch(1)

get_all_data(1)

classify(1)

build_vocab_dict(1)

buildLang(1)

_iterate(1)

valid_epoch(1)

Méthodes fréquemment utilisées

Dataset (30)

build (4)

save (3)

create_instances (2)

preprocess (1)

update_X (1)

train_epoch (1)

to_sent_numpy (1)

to_bow_numpy (1)

test_epoch (1)

Méthodes fréquemment utilisées

store_pivots (1)

set_seq_len (1)

set_data_dir (1)

set_batch_size (1)

get_word2idx (1)

join (1)

GenerateBatches (1)

get_tag2idx (1)

get_prec_recl (1)

get_nwords (1)

get_ntags (1)

get_batch (1)

get_all_data (1)

classify (1)

build_vocab_dict (1)

buildLang (1)

_iterate (1)

valid_epoch (1)

Méthodes fréquemment utilisées

get_ntags (1)

get_batch (1)

get_all_data (1)

classify (1)

build_vocab_dict (1)

buildLang (1)

_iterate (1)

valid_epoch (1)

Exemple #1

0

Afficher le fichier

def main(config, local): n_gpu = int(GPU_NUM) n_gpu = 1 if n_gpu == 0 else n_gpu np.random.seed(config.random_seed) if n_gpu > 0: torch.cuda.manual_seed_all(config.random_seed) # Create data instances vocab = Vocabulary(config.vocab_path) if config.mode == 'train': # Prepare train data loader train_dataset, val_dataset = Dataset(vocab), Dataset(vocab) train_path = os.path.join(config.data_dir, 'train_data/train_data') val_path = os.path.join(config.data_dir, 'train_data/val_data') train_dataset.create_instances(train_path, config.max_seq_length, type='train') val_dataset.create_instances(val_path, config.max_seq_length, type='val') train_loader = DataLoader(train_dataset, batch_size=config.batch_size * n_gpu, shuffle=True) val_loader = DataLoader(val_dataset, batch_size=config.batch_size * n_gpu) else: train_loader, val_loader = None, None trainer = Trainer(config, n_gpu, vocab, train_loader, val_loader) if nsml.IS_ON_NSML: bind_model(trainer.model, vocab, config) if config.pause: nsml.paused(scope=local) if config.mode == 'train': trainer.train()

Exemple #2

0

Afficher le fichier

def inference(path, model, vocab, config, **kwargs): model.eval() test_dataset = Dataset(vocab) test_path = os.path.join(path, 'test_data') test_dataset.create_instances(test_path, config.max_seq_length, type='test') test_loader = DataLoader(test_dataset, batch_size=1) pred_results = [] for step, batch in enumerate(test_loader): batch = tuple(t.to(device) for t in batch) batch = sort_batch(batch) input_ids, input_lengths, labels = batch outputs = model(input_ids) top_1_result = outputs['predicted_intents'][0].item() pred_results.append([step, top_1_result]) return pred_results