Ejemplos de Dataset.save en Python

Lenguaje de programación: Python

Namespace/Package Name: data_utils

Clase / Tipo: Dataset

Método / Función: save

Ejemplos en hotexamples.com: 3

Python Dataset.save - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de data_utils.Dataset.save extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Dataset(30)

build(4)

save(3)

create_instances(2)

preprocess(1)

update_X(1)

train_epoch(1)

to_sent_numpy(1)

to_bow_numpy(1)

test_epoch(1)

store_pivots(1)

set_seq_len(1)

set_data_dir(1)

set_batch_size(1)

get_word2idx(1)

join(1)

GenerateBatches(1)

get_tag2idx(1)

get_prec_recl(1)

get_nwords(1)

get_ntags(1)

get_batch(1)

get_all_data(1)

classify(1)

build_vocab_dict(1)

buildLang(1)

_iterate(1)

valid_epoch(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: train_large.py Proyecto: mbencherif/language-model

valid_data_dir = '/mnt/raid1/billion-word-corpus/1-billion-word-language-modeling-benchmark/heldout-monolingual.tokenized.shuffled/'
save_dir = '/home/ab455/language-model/checkpoints/'
num_words = None

seq_len = 25
batch_size = 256
valid_batch_size = 16 ## Needs to be smaller due to memory issues
embed_size = 128
num_epochs = 20
hidden_size = 256
num_layers = 2

dataset = Dataset(data_dir,num_words)
dataset.set_batch_size(batch_size)
dataset.set_seq_len(seq_len)
dataset.save('./checkpoints_large/')

params = {}
params['vocab_size'] = dataset.vocab_size
params['num_classes'] = dataset.vocab_size
params['batch_size'] = batch_size
params['seq_len'] = seq_len
params['hidden_dim'] = hidden_size
params['num_layers'] = num_layers
params['embed_size'] = embed_size

model = LargeLanguageModel(params)
model.compile()
eval_softmax = 5
for epoch in range(num_epochs):
    dataset.set_data_dir(data_dir)

Ejemplo n.º 2

Mostrar archivo

Archivo: train.py Proyecto: simon555/LM_word

os.makedirs(directoryOutLogs)

num_words = None

seq_len = 25
batch_size = 16
valid_batch_size = 16  ## Needs to be smaller due to memory issues
embed_size = 64
num_epochs = 20
hidden_size = 64
num_layers = 1

dataset = Dataset(data_dir, num_words)
dataset.set_batch_size(batch_size)
dataset.set_seq_len(seq_len)
dataset.save(dataset_specific_info)

params = {}

#take account of the 0 token for padding
params['vocab_size'] = dataset.vocab_size + 1
params['num_classes'] = dataset.vocab_size
params['batch_size'] = batch_size
params['valid_batch_size'] = valid_batch_size
params['seq_len'] = seq_len
params['hidden_dim'] = hidden_size
params['num_layers'] = num_layers
params['embed_size'] = embed_size
params['directoryOutLogs'] = directoryOutLogs

model = LanguageModel(params)

Ejemplo n.º 3

Mostrar archivo

valid_data_dir = '/mnt/raid1/billion-word-corpus/1-billion-word-language-modeling-benchmark/heldout-monolingual.tokenized.shuffled/'
save_dir = '/home/ab455/language-model/checkpoints/'
num_words = None

seq_len = 25
batch_size = 192
valid_batch_size = 16  ## Needs to be smaller due to memory issues
embed_size = 128
num_epochs = 20
hidden_size = 256
num_layers = 1

dataset = Dataset(data_dir, num_words)
dataset.set_batch_size(batch_size)
dataset.set_seq_len(seq_len)
dataset.save('./checkpoints/')

params = {}
params['vocab_size'] = dataset.vocab_size
params['num_classes'] = dataset.vocab_size
params['batch_size'] = batch_size
params['seq_len'] = seq_len
params['hidden_dim'] = hidden_size
params['num_layers'] = num_layers
params['embed_size'] = embed_size

model = LanguageModel(params)
model.compile()
eval_softmax = 5
for epoch in range(num_epochs):
    dataset.set_data_dir(data_dir)