Esempi in Python per DDPG.Tensor

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ddpg

Classe/tipologia: DDPG

Metodo/funzione: Tensor

Esempi su hotexamples.com: 2

DDPG.Tensor in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per ddpg.DDPG.Tensor, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DDPG(30)

evaluate_actor(17)

choose_action(12)

add_experience(8)

get_action(7)

eval(6)

act(5)

get_stats(4)

adapt_param_noise(4)

actor(3)

best_reward(2)

calc_last_error(2)

Action(2)

before_cycle(2)

expl_rate_decay(2)

get_action_noise(2)

hard_update(2)

before_epoch(2)

calc_action(2)

assign_global_optimizer(2)

addMemory(2)

Tensor(2)

Update(2)

apply_lr_decay(2)

initail_net(2)

add_optim(2)

freeze_shared_weights(1)

Add2Mem(1)

get_variables_to_save(1)

apply_action(1)

get_shared_weights(1)

get_model(1)

get_loss(1)

Train(1)

build(1)

act_without_noise(1)

converter(1)

experience(1)

action_taking(1)

ActorPredict(1)

eval_all(1)

add_step(1)

ddpg_update(1)

cuda(1)

critic(1)

eval_all1(1)

Esempio n. 1

Mostra file

File: test.py Progetto: ythuangyt/Robust-Reinforcement-Learning-via-Adversarial-training-with-Langevin-Dynamics

            state, reward, done, _ = _env.step(action.cpu().numpy()[0])
            total_reward += reward

            state = agent.Tensor([state])
            if done:
                break
    return total_reward


test_episodes = 100
for env_name in [args.env]:#os.listdir(base_dir):
    
    env = NormalizedActions(gym.make(env_name))

    agent = DDPG(beta=0.9, epsilon=0, learning_rate=1e-4, gamma=0.99, tau=0.01, hidden_size_dim0=args.hidden_size, hidden_size_dim1=args.hidden_size, num_inputs=env.observation_space.shape[0], action_space=env.action_space, train_mode=False, alpha=0, replay_size=0, optimizer = 0, two_player=args.two_player, normalize_obs=True)
    noise = uniform.Uniform(agent.Tensor([-1.0]), agent.Tensor([1.0]))

    basic_bm = copy.deepcopy(env.env.env.model.body_mass.copy())

    env_dir = base_dir + env_name + '/'
    for optimizer in [args.optimizer]: #['RMSprop', 'SGLD_thermal_0.01', 'SGLD_thermal_0.001', 'SGLD_thermal_0.0001', 'SGLD_thermal_1e-05']:
        for noise_type in [args.action_noise]: 
            noise_dir = env_dir + optimizer + '/' + noise_type + '/nr_mdp_' + str(args.alpha) + '_1/'	
            if os.path.exists(noise_dir):
                for subdir in sorted(os.listdir(noise_dir)):
                    results = {}
                    
                    run_number = 0
                    dir = noise_dir + subdir #+ '/' + str(run_number)
                    print(dir)
                    if os.path.exists(noise_dir + subdir)\

Esempio n. 2

Mostra file

    def reset_noise(a, a_noise):
        if a_noise is not None:
            a_noise.reset()

    total_steps = 0
    print(base_dir)

    if args.num_steps is not None:
        assert args.num_epochs is None
        nb_epochs = int(args.num_steps) // (args.num_epochs_cycles *
                                            args.num_rollout_steps)
    else:
        nb_epochs = 500

    state = agent.Tensor([env.reset()])
    eval_state = agent.Tensor([eval_env.reset()])

    eval_reward = 0
    episode_reward = 0
    agent.train()

    reset_noise(agent, normalnoise)

    if args.visualize:
        vis = visdom.Visdom(env=base_dir)
    else:
        vis = None

    train_steps = 0
    ratio = args.ratio + 1