Ejemplos de DDPGAgent.save_weights en Python

Lenguaje de programación: Python

Namespace/Package Name: ddpg

Clase / Tipo: DDPGAgent

Método / Función: save_weights

Ejemplos en hotexamples.com: 2

Python DDPGAgent.save_weights - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de ddpg.DDPGAgent.save_weights extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

DDPGAgent(30)

act(5)

load_models(4)

test(3)

update(3)

compile(3)

get_action(3)

save_models(2)

save_weights(2)

test_model(2)

train(2)

fit(2)

train_one_episode(2)

remember(1)

take_action(1)

save(1)

update_target_net(1)

replay(1)

noisy_act(1)

record(1)

optimize(1)

log2summary(1)

load_model(1)

load(1)

learning(1)

learn(1)

get_exploration_action(1)

get_exploitation_action(1)

eval(1)

choose_action(1)

action_input(1)

update_targets(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: run_swmm_DDPG.py Proyecto: Kudbettin/Stormwater

critic = Model(inputs=[action_input, observation_input], outputs=x)

memory = SequentialMemory(limit=1000, window_length=1)
random_process = OrnsteinUhlenbeckProcess(size=nb_actions,
                                          theta=.15,
                                          mu=0.,
                                          sigma=.3)
agent = DDPGAgent(nb_actions=nb_actions,
                  actor=actor,
                  critic=critic,
                  critic_action_input=action_input,
                  memory=memory,
                  nb_steps_warmup_critic=100,
                  nb_steps_warmup_actor=300,
                  random_process=random_process,
                  gamma=.995,
                  target_model_update=2e-3)
agent.compile(Adam(lr=.005, clipnorm=1.), metrics=['mae'])

agent.fit(env,
          nb_steps=555,
          visualize=False,
          verbose=0,
          nb_max_episode_steps=95)

agent.save_weights('weights/ddpg_{}_weights.h5f'.format("stormwater"),
                   overwrite=True)

agent.test(env, nb_episodes=1, visualize=True, nb_max_episode_steps=95)

env.graph("plots/test_plot_")

Ejemplo n.º 2

Mostrar archivo

                      env=env,
                      memory=(memory, episode_mem),
                      critic_goal_input=goal_input,
                      delta_clip=1.0,
                      nb_steps_warmup_critic=1000,
                      nb_steps_warmup_actor=1000,
                      random_process=random_process,
                      gamma=0.98,
                      target_model_update=0.001,
                      val_goal=args.val_goal,
                      vectorized=args.vectorized)

    agent.compile([Adam(lr=1e-4), Adam(lr=1e-3)], metrics=['mae'])

    agent.fit(env,
              nb_steps=200000,
              folder_to_save=folder_to_save,
              visualize=False,
              verbose=1,
              reward_type=reward_type,
              nb_max_episode_steps=50,
              max_tau=12)

    agent.save_weights(os.path.join(
        folder_to_save, 'ddpg_{}_weights_{}.h5f'.format(ENV_NAME,
                                                        reward_type)),
                       overwrite=True)
    sys.exit()
    # Finally, evaluate our algorithm for 5 episodes.
    agent.test(env, nb_episodes=5, visualize=True, nb_max_episode_steps=50)