Exemplos de PolicyGradientAgent.update em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: PolicyGradientAgent

Método / Função: update

Exemplos em hotexamples.com: 1

PolicyGradientAgent.update em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de PolicyGradientAgent.PolicyGradientAgent.update em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

PolicyGradientAgent(4)

act(1)

get_action(1)

learn(1)

load_model(1)

load_state(1)

persist_state(1)

remember(1)

save_model(1)

save_state(1)

update(1)

Métodos Frequentes

PolicyGradientAgent (4)

act (1)

get_action (1)

learn (1)

load_model (1)

load_state (1)

persist_state (1)

remember (1)

save_model (1)

save_state (1)

Métodos Frequentes

update (1)

Exemplo n.º 1

0

Exibir arquivo

action = agent.act(state, is_training=True) next_state, reward, done, _ = env.step(action) next_state = np.reshape(next_state, [1, state_size]) agent.remember(state, action, reward) state = next_state cum_reward += reward if done: avg_score += cum_reward break current_loss = agent.update()[0] loss += current_loss if episode % 100 == 0 and episode != 0: print("Episode: " + str(episode) + "/" + str(train_episodes) + ", score: " + str(avg_score/100) + ", Loss : " + str(loss/100)) avg_score = 0 loss = 0 print("Testing...") test_episodes = 100 score = 0 for i in range(test_episodes): state = env.reset()