Exemplos de PolicyGradientAgent.act em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: PolicyGradientAgent

Método / Função: act

Exemplos em hotexamples.com: 1

PolicyGradientAgent.act em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de PolicyGradientAgent.PolicyGradientAgent.act em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

PolicyGradientAgent(4)

act(1)

get_action(1)

learn(1)

load_model(1)

load_state(1)

persist_state(1)

remember(1)

save_model(1)

save_state(1)

update(1)

Métodos Frequentes

PolicyGradientAgent (4)

act (1)

get_action (1)

learn (1)

load_model (1)

load_state (1)

persist_state (1)

remember (1)

save_model (1)

save_state (1)

Métodos Frequentes

update (1)

Exemplo n.º 1

0

Exibir arquivo

state_size = 8 agent = PolicyGradientAgent(state_size, action_size) print("Training...") train_episodes = 5000 avg_score = 0 loss = 0 for episode in range(train_episodes): state = env.reset() state = np.reshape(state, [1, state_size]) cum_reward = 0 for i in range(1000): action = agent.act(state, is_training=True) next_state, reward, done, _ = env.step(action) next_state = np.reshape(next_state, [1, state_size]) agent.remember(state, action, reward) state = next_state cum_reward += reward if done: avg_score += cum_reward break current_loss = agent.update()[0] loss += current_loss