Python DDPGAgent.save_weights 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ddpg

클래스/타입: DDPGAgent

메소드/함수: save_weights

hotexamples.com에서의 예제들: 2

Python DDPGAgent.save_weights - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ddpg.DDPGAgent.save_weights에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DDPGAgent(30)

act(5)

load_models(4)

test(3)

update(3)

compile(3)

get_action(3)

save_models(2)

save_weights(2)

test_model(2)

train(2)

fit(2)

train_one_episode(2)

remember(1)

take_action(1)

save(1)

update_target_net(1)

replay(1)

noisy_act(1)

record(1)

optimize(1)

log2summary(1)

load_model(1)

load(1)

learning(1)

learn(1)

get_exploration_action(1)

get_exploitation_action(1)

eval(1)

choose_action(1)

action_input(1)

update_targets(1)

예제 #1

파일 보기

파일: run_swmm_DDPG.py 프로젝트: Kudbettin/Stormwater

critic = Model(inputs=[action_input, observation_input], outputs=x)

memory = SequentialMemory(limit=1000, window_length=1)
random_process = OrnsteinUhlenbeckProcess(size=nb_actions,
                                          theta=.15,
                                          mu=0.,
                                          sigma=.3)
agent = DDPGAgent(nb_actions=nb_actions,
                  actor=actor,
                  critic=critic,
                  critic_action_input=action_input,
                  memory=memory,
                  nb_steps_warmup_critic=100,
                  nb_steps_warmup_actor=300,
                  random_process=random_process,
                  gamma=.995,
                  target_model_update=2e-3)
agent.compile(Adam(lr=.005, clipnorm=1.), metrics=['mae'])

agent.fit(env,
          nb_steps=555,
          visualize=False,
          verbose=0,
          nb_max_episode_steps=95)

agent.save_weights('weights/ddpg_{}_weights.h5f'.format("stormwater"),
                   overwrite=True)

agent.test(env, nb_episodes=1, visualize=True, nb_max_episode_steps=95)

env.graph("plots/test_plot_")

예제 #2

파일 보기

                      env=env,
                      memory=(memory, episode_mem),
                      critic_goal_input=goal_input,
                      delta_clip=1.0,
                      nb_steps_warmup_critic=1000,
                      nb_steps_warmup_actor=1000,
                      random_process=random_process,
                      gamma=0.98,
                      target_model_update=0.001,
                      val_goal=args.val_goal,
                      vectorized=args.vectorized)

    agent.compile([Adam(lr=1e-4), Adam(lr=1e-3)], metrics=['mae'])

    agent.fit(env,
              nb_steps=200000,
              folder_to_save=folder_to_save,
              visualize=False,
              verbose=1,
              reward_type=reward_type,
              nb_max_episode_steps=50,
              max_tau=12)

    agent.save_weights(os.path.join(
        folder_to_save, 'ddpg_{}_weights_{}.h5f'.format(ENV_NAME,
                                                        reward_type)),
                       overwrite=True)
    sys.exit()
    # Finally, evaluate our algorithm for 5 episodes.
    agent.test(env, nb_episodes=5, visualize=True, nb_max_episode_steps=50)