Esempi in Python per MADDPG.train

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: maddpg

Classe/tipologia: MADDPG

Metodo/funzione: train

Esempi su hotexamples.com: 2

MADDPG.train in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per maddpg.MADDPG.train, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

MADDPG(30)

act(26)

update_targets(12)

update(9)

reset(5)

step(4)

learn(4)

save(4)

test(3)

choose_action(2)

run(2)

update_policy(2)

train(2)

store_transition(1)

take_actions(1)

select_action_test(1)

select_action(1)

save_weights(1)

save_model(1)

save_checkpoint(1)

actors_target(1)

reset_ounoise(1)

actor_optimizer(1)

load_model(1)

load_from_file(1)

load_critic(1)

load_checkpoint(1)

load_actor(1)

load(1)

init_from_save(1)

init_from_env(1)

critics_target(1)

critic_optimizer(1)

create_agents(1)

load_weights(1)

Esempio n. 1

Mostra file

]
# handle invalid dir char
for i in range(len(model_names)):
    model_names[i] = model_names[i].replace('[', '').replace(']', '').replace(
        ' ', '').replace(',', '_')
# handle standard arg, i.e., {}
model_names = ['standard' if name == '' else name for name in model_names]

# model loop
for i in trange(len(args), desc='model', leave=True):
    model_dir = '{}/{}'.format(root, model_names[i])
    os.mkdir(model_dir)
    # log cmd
    with open('{}/cmd_config.txt'.format(model_dir), 'w') as f:
        for k, v in control_args.items():
            f.write(str(k) + ': ' + str(v) + '\n')
    arg = args[i]
    # repeat loop
    for n in trange(control_args['repeat'], desc='repeat', leave=True):
        dir = '{}/{}'.format(model_dir, n)
        os.mkdir(dir)
        maddpg = MADDPG(env, **arg)
        if control_args.has_key('load'):
            model_path = control_args['load']
            maddpg.load_actor(model_path)
            maddpg.load_critic(model_path)
        if control_args['train']:
            maddpg.train(dir, control_args['save_interval'])
            maddpg.save(dir)
        maddpg.test(dir, n=control_args['n_test'])

Esempio n. 2

Mostra file

File: train.py Progetto: pestipeti/UdacityDRLTennis

if __name__ == "__main__":

    # Configuration
    n_episodes = 5000

    # Set seed
    seed_everything(42)

    # Unitiy environment
    env = UnityEnvironment("./Tennis_Linux/Tennis.x86_64")

    # Agent
    agent = TennisMultiAgent(state_size=24, action_size=2, n_agents=2)

    # DDPG
    maddpg = MADDPG(env=env, agent=agent)
    scores, avg_scores = maddpg.train(n_episodes=n_episodes)

    # Close the environment
    env.close()

    # Plot scores
    fig, ax = plt.subplots(figsize=(10, 6))
    ax.plot(np.linspace(1, n_episodes + 1, n_episodes), scores)
    ax.plot(np.linspace(1, n_episodes + 1, n_episodes), avg_scores)
    ax.set_xlabel("Episodes")
    ax.set_ylabel("Score per Episode")
    ax.set_title("Training progress of MADDPG model")

    fig.savefig('train_scores.png')