Python Dataset.save примеры использования

Язык программирования: Python

Пространство имен/Пакет: data_utils

Класс/Тип: Dataset

Метод/Функция: save

Примеров на hotexamples.com: 3

Python Dataset.save - 3 примера найдено. Это лучшие примеры Python кода для data_utils.Dataset.save, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Dataset(30)

build(4)

save(3)

create_instances(2)

preprocess(1)

update_X(1)

train_epoch(1)

to_sent_numpy(1)

to_bow_numpy(1)

test_epoch(1)

store_pivots(1)

set_seq_len(1)

set_data_dir(1)

set_batch_size(1)

get_word2idx(1)

join(1)

GenerateBatches(1)

get_tag2idx(1)

get_prec_recl(1)

get_nwords(1)

get_ntags(1)

get_batch(1)

get_all_data(1)

classify(1)

build_vocab_dict(1)

buildLang(1)

_iterate(1)

valid_epoch(1)

Пример #1

Показать файл

Файл: train_large.py Проект: mbencherif/language-model

valid_data_dir = '/mnt/raid1/billion-word-corpus/1-billion-word-language-modeling-benchmark/heldout-monolingual.tokenized.shuffled/'
save_dir = '/home/ab455/language-model/checkpoints/'
num_words = None

seq_len = 25
batch_size = 256
valid_batch_size = 16 ## Needs to be smaller due to memory issues
embed_size = 128
num_epochs = 20
hidden_size = 256
num_layers = 2

dataset = Dataset(data_dir,num_words)
dataset.set_batch_size(batch_size)
dataset.set_seq_len(seq_len)
dataset.save('./checkpoints_large/')

params = {}
params['vocab_size'] = dataset.vocab_size
params['num_classes'] = dataset.vocab_size
params['batch_size'] = batch_size
params['seq_len'] = seq_len
params['hidden_dim'] = hidden_size
params['num_layers'] = num_layers
params['embed_size'] = embed_size

model = LargeLanguageModel(params)
model.compile()
eval_softmax = 5
for epoch in range(num_epochs):
    dataset.set_data_dir(data_dir)

Пример #2

Показать файл

Файл: train.py Проект: simon555/LM_word

os.makedirs(directoryOutLogs)

num_words = None

seq_len = 25
batch_size = 16
valid_batch_size = 16  ## Needs to be smaller due to memory issues
embed_size = 64
num_epochs = 20
hidden_size = 64
num_layers = 1

dataset = Dataset(data_dir, num_words)
dataset.set_batch_size(batch_size)
dataset.set_seq_len(seq_len)
dataset.save(dataset_specific_info)

params = {}

#take account of the 0 token for padding
params['vocab_size'] = dataset.vocab_size + 1
params['num_classes'] = dataset.vocab_size
params['batch_size'] = batch_size
params['valid_batch_size'] = valid_batch_size
params['seq_len'] = seq_len
params['hidden_dim'] = hidden_size
params['num_layers'] = num_layers
params['embed_size'] = embed_size
params['directoryOutLogs'] = directoryOutLogs

model = LanguageModel(params)

Пример #3

Показать файл

valid_data_dir = '/mnt/raid1/billion-word-corpus/1-billion-word-language-modeling-benchmark/heldout-monolingual.tokenized.shuffled/'
save_dir = '/home/ab455/language-model/checkpoints/'
num_words = None

seq_len = 25
batch_size = 192
valid_batch_size = 16  ## Needs to be smaller due to memory issues
embed_size = 128
num_epochs = 20
hidden_size = 256
num_layers = 1

dataset = Dataset(data_dir, num_words)
dataset.set_batch_size(batch_size)
dataset.set_seq_len(seq_len)
dataset.save('./checkpoints/')

params = {}
params['vocab_size'] = dataset.vocab_size
params['num_classes'] = dataset.vocab_size
params['batch_size'] = batch_size
params['seq_len'] = seq_len
params['hidden_dim'] = hidden_size
params['num_layers'] = num_layers
params['embed_size'] = embed_size

model = LanguageModel(params)
model.compile()
eval_softmax = 5
for epoch in range(num_epochs):
    dataset.set_data_dir(data_dir)