Exemplos de Trainer.addExperience em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: Trainer

Classe / Tipo: Trainer

Método / Função: addExperience

Exemplos em hotexamples.com: 1

Trainer.addExperience em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de Trainer.Trainer.addExperience em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Trainer(30)

fit(9)

data_generator(6)

InitParams(5)

InitUpdateRule(5)

learning(4)

getSaveFilePath(4)

evaluate(4)

get_valid_accuracy(3)

error_estimate(3)

evolve(3)

flush_params_to_dict(2)

add_default_hyperparameters_if_not_overriden(2)

execute(2)

_unpack_resDict(2)

attack_other_trainer_pokemon(1)

generate(1)

generateTrainingSetFile(1)

getCheckpointPth(1)

getLabelFeatures(1)

getName(1)

addExperience(1)

getScores(1)

get_disp_images(1)

get_mean_and_standard_deviation_difference_results(1)

get_parameters(1)

get_predictions(1)

get_train_batch(1)

get_test_batch(1)

get_weights(1)

graph_loss(1)

handle_files(1)

hinge_and_mis(1)

hyp_opt(1)

infer(1)

initComm(1)

initDevPerplexities(1)

initialize(1)

Train(1)

learningHingeLoss(1)

learningRate(1)

restore(1)

gen_relative_graphs(1)

fit_final(1)

backward_discriminator(1)

close(1)

backward_generator(1)

batchSize(1)

batch_add_to_system(1)

begin_training(1)

Métodos Frequentes

Trainer (30)

fit (9)

data_generator (6)

InitParams (5)

InitUpdateRule (5)

learning (4)

getSaveFilePath (4)

evaluate (4)

get_valid_accuracy (3)

error_estimate (3)

Métodos Frequentes

evolve (3)

flush_params_to_dict (2)

add_default_hyperparameters_if_not_overriden (2)

execute (2)

_unpack_resDict (2)

attack_other_trainer_pokemon (1)

generate (1)

generateTrainingSetFile (1)

getCheckpointPth (1)

getLabelFeatures (1)

getName (1)

addExperience (1)

getScores (1)

get_disp_images (1)

get_mean_and_standard_deviation_difference_results (1)

get_parameters (1)

get_predictions (1)

get_train_batch (1)

get_test_batch (1)

get_weights (1)

Métodos Frequentes

getName (1)

addExperience (1)

getScores (1)

get_disp_images (1)

get_mean_and_standard_deviation_difference_results (1)

get_parameters (1)

get_predictions (1)

get_train_batch (1)

get_test_batch (1)

get_weights (1)

graph_loss (1)

handle_files (1)

hinge_and_mis (1)

hyp_opt (1)

infer (1)

initComm (1)

initDevPerplexities (1)

initialize (1)

Train (1)

learningHingeLoss (1)

learningRate (1)

restore (1)

gen_relative_graphs (1)

fit_final (1)

backward_discriminator (1)

close (1)

backward_generator (1)

batchSize (1)

batch_add_to_system (1)

begin_training (1)

Métodos Frequentes

graph_loss (1)

handle_files (1)

hinge_and_mis (1)

hyp_opt (1)

infer (1)

initComm (1)

initDevPerplexities (1)

initialize (1)

Train (1)

learningHingeLoss (1)

learningRate (1)

restore (1)

gen_relative_graphs (1)

fit_final (1)

backward_discriminator (1)

close (1)

backward_generator (1)

batchSize (1)

batch_add_to_system (1)

begin_training (1)

build (1)

catchPoke (1)

change_current_pokemon (1)

change_reward (1)

change_reward_streak (1)

checkIfAllPlayersConnected (1)

check_result (1)

clear_record (1)

convert_image_to_binary (1)

fetch_tree_nodes (1)

createNet (1)

createTeamFromListOfDicts (1)

attack (1)

derive_expret_beta (1)

end (1)

epoch_time (1)

are_equals (1)

eval (1)

add_training_to_schedule (1)

add_pokemon (1)

Exemplo n.º 1

0

Exibir arquivo

def run(episodes, discount, useStreak): start_time = time.time() print('run with: ' + str(discount) + str(useStreak)) batch_size = 32 hidden_dim = 300 experienceSize = 20000 epsilon_min_after = 1500 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") writer = SummaryWriter('runs/run_discount_' + str(discount) + '_streak_' + str(useStreak)) trainer = Trainer(hidden_dim, experienceSize, discount, batch_size, device, writer) for e in range(episodes): observation = trainer.reset() done = False batchReward = 0 steps = 0 threes = 0 while not done: action = trainer.policyAction(observation['board'], e, epsilon_min_after) old_obs = observation observation, reward, done, _ = trainer.step(int(action)) reshaped = trainer.reshape(torch.tensor(observation['board'])) threes += trainer.streakReward(trainer.player, reshaped, int(action)) if useStreak: reward = trainer.change_reward_streak(reward, done, reshaped, int(action), useStreak) else: reward = trainer.change_reward(reward, done) next_state = observation['board'] exp = Experience(old_obs['board'], action, reward, next_state, int(done)) trainer.addExperience(exp) batchReward += reward loss = trainer.train() steps += 1 threes /= 3 if loss != None: writer.add_scalar('trainLoss', loss, e) writer.add_scalar('batchReward', batchReward, e) writer.add_scalar('steps', steps, e) writer.add_scalar('threes', threes, e) if (e % 1000 == 0) and (e > 0): trainer.switchPosition() if e % 50 == 0: trainer.synchronize() firstStep = str( trainer.policy( trainer.reshape(torch.tensor( trainer.reset()['board'])))[0]) writer.add_text('first_qs', firstStep, e) if e % 50 == 0: trainer.save("model_state_discount_" + str(discount) + '_useStreak_' + str(useStreak)) # print(e) # print("episode: " + str(e) + " meanReward generateEpisodes: " + str(batchReward) + " meanLoss: " + str(loss)) # print("steps: " + str(steps)) # firstStep = str(trainer.policy(trainer.reshape(torch.tensor(trainer.reset()['board'])))[0]) # with torch.no_grad(): # print(firstStep) evaluator = Evaluator(100, trainer) evaluator.winPercentage(e) # if e % 25000 == 0: # trainer.switch() # trainer.save("model_state_"+str(e)) print("--- %s seconds ---" % (time.time() - start_time))