Exemplos de DDPGAgent.fit em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: ddpg

Classe / Tipo: DDPGAgent

Método / Função: fit

Exemplos em hotexamples.com: 2

DDPGAgent.fit em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de ddpg.DDPGAgent.fit em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

DDPGAgent(30)

act(5)

load_models(4)

test(3)

update(3)

compile(3)

get_action(3)

save_models(2)

save_weights(2)

test_model(2)

train(2)

fit(2)

train_one_episode(2)

remember(1)

take_action(1)

save(1)

update_target_net(1)

replay(1)

noisy_act(1)

record(1)

optimize(1)

log2summary(1)

load_model(1)

load(1)

learning(1)

learn(1)

get_exploration_action(1)

get_exploitation_action(1)

eval(1)

choose_action(1)

action_input(1)

update_targets(1)

Métodos Frequentes

DDPGAgent (30)

act (5)

load_models (4)

test (3)

update (3)

compile (3)

get_action (3)

save_models (2)

save_weights (2)

test_model (2)

Métodos Frequentes

train (2)

fit (2)

train_one_episode (2)

remember (1)

take_action (1)

save (1)

update_target_net (1)

replay (1)

noisy_act (1)

record (1)

optimize (1)

log2summary (1)

load_model (1)

load (1)

learning (1)

learn (1)

get_exploration_action (1)

get_exploitation_action (1)

eval (1)

choose_action (1)

Métodos Frequentes

optimize (1)

log2summary (1)

load_model (1)

load (1)

learning (1)

learn (1)

get_exploration_action (1)

get_exploitation_action (1)

eval (1)

choose_action (1)

action_input (1)

update_targets (1)

Métodos Frequentes

action_input (1)

update_targets (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: run_swmm_DDPG_New.py Projeto: smsr7/Stormwater

actor.add(Dense(8)) actor.add(Activation('relu')) actor.add(Dense(nb_actions)) actor.add(Activation('sigmoid')) action_input = Input(shape=(nb_actions,), name='action_input') observation_input = Input(shape=(1,) + (11,), name='observation_input') flattened_observation = Flatten()(observation_input) x = Concatenate()([action_input, flattened_observation]) x = Dense(32)(x) x = Activation('relu')(x) x = Dense(32)(x) x = Activation('relu')(x) x = Dense(32)(x) x = Activation('relu')(x) x = Dense(1)(x) x = Activation('linear')(x) critic = Model(inputs=[action_input, observation_input], outputs=x) memory = SequentialMemory(limit=100000, window_length=1) random_process = OrnsteinUhlenbeckProcess(size=nb_actions, theta=.15, mu=0., sigma=.1) agent = DDPGAgent(nb_actions=nb_actions, actor=actor, critic=critic, critic_action_input=action_input, memory=memory, nb_steps_warmup_critic=100, nb_steps_warmup_actor=10, random_process=random_process, gamma=.995, target_model_update=1e-3) agent.compile(Adam(lr=.0005, clipnorm=1.), metrics=['mae']) agent.fit(env, nb_steps=10000, visualize=False, verbose=0, nb_max_episode_steps=95) #agent.save_weights('weights/ddpg_{}_weights.h5f'.format("stormwater"), overwrite=True) agent.test(env, nb_episodes=15, visualize=False, nb_max_episode_steps=95, plt="")

Exemplo n.º 2

0

Exibir arquivo

env=env, memory=(memory, episode_mem), critic_goal_input=goal_input, delta_clip=1.0, nb_steps_warmup_critic=1000, nb_steps_warmup_actor=1000, random_process=random_process, gamma=0.98, target_model_update=0.001, val_goal=args.val_goal, vectorized=args.vectorized) agent.compile([Adam(lr=1e-4), Adam(lr=1e-3)], metrics=['mae']) agent.fit(env, nb_steps=200000, folder_to_save=folder_to_save, visualize=False, verbose=1, reward_type=reward_type, nb_max_episode_steps=50, max_tau=12) agent.save_weights(os.path.join( folder_to_save, 'ddpg_{}_weights_{}.h5f'.format(ENV_NAME, reward_type)), overwrite=True) sys.exit() # Finally, evaluate our algorithm for 5 episodes. agent.test(env, nb_episodes=5, visualize=True, nb_max_episode_steps=50)