Exemplos de PolicyGradientAgent.load_model em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: PolicyGradientAgent

Método / Função: load_model

Exemplos em hotexamples.com: 1

PolicyGradientAgent.load_model em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de PolicyGradientAgent.PolicyGradientAgent.load_model em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

PolicyGradientAgent(4)

act(1)

get_action(1)

learn(1)

load_model(1)

load_state(1)

persist_state(1)

remember(1)

save_model(1)

save_state(1)

update(1)

Métodos Frequentes

PolicyGradientAgent (4)

act (1)

get_action (1)

learn (1)

load_model (1)

load_state (1)

persist_state (1)

remember (1)

save_model (1)

save_state (1)

Métodos Frequentes

update (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: lunar_lander.py Projeto: jeffery1236/policy-gradient

best_score = -np.inf scores = [] eps_history = [] state_dims = env.observation_space.shape[0] num_actions = env.action_space.n lr = 0.001 gamma = 0.99 agent = PolicyGradientAgent(lr=lr, gamma=gamma, state_dims=state_dims, num_actions=num_actions, env_name='lunar_lander', checkpoint_dir='temp/') if test_mode: agent.load_model() # env = gym.wrappers.Monitor(env, 'temp/lunar_lander', # video_callable=lambda episode_id: True, force=True) for count in range(num_games): state = env.reset() done = False score = 0 while not done: env.render() action = agent.get_action(state) new_state, reward, done, _ = env.step(action) agent.reward_history.append(reward)