Esempi in Python per Agent.act

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: dqn.agent

Classe/tipologia: Agent

Metodo/funzione: act

Esempi su hotexamples.com: 2

Agent.act in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per dqn.agent.Agent.act, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Agent(30)

play(23)

train(9)

predict(3)

get_action(3)

save_model(2)

act(2)

total_loss(2)

total_q(2)

observe(2)

update(2)

load(2)

inject_summary(2)

update_count(2)

save(2)

train_poison(1)

transfer_weights(1)

train_ep(1)

update_q_network(1)

test_video(1)

update_target_model(1)

step(1)

save_weight_to_pkl(1)

q_target(1)

reset(1)

randomplay(1)

q_eval(1)

play_poison(1)

play_mine(1)

play_image(1)

play2(1)

network_synchronize(1)

memorize(1)

load_weight_from_pkl(1)

init_for_stage(1)

exp_play(1)

e_greedy_action(1)

updated_target_q_network(1)

Esempio n. 1

Mostra file

    score, steps_taken, collision = 0, 0, False

    # Build initial observations for each agent
    for a in range(flags.num_agents):
        agent_obs[a] = normalize_observation(
            obs[a], flags.tree_depth, zero_center=flags.agent_type == 'dqn')
        agent_obs_buffer[a] = agent_obs[a].copy()

    # Run an episode
    for step in range(max_steps):
        update_values = [False] * flags.num_agents
        action_dict = {}

        for a in range(flags.num_agents):
            if info['action_required'][a]:
                action_dict[a] = agent.act(agent_obs[a], eps=eps)
                # action_dict[a] = np.random.randint(5)
                update_values[a] = True
                steps_taken += 1
            else:
                action_dict[a] = 0

        # Environment step
        obs, rewards, done, info = env.step(action_dict)
        score += sum(rewards.values()) / flags.num_agents

        # Check for collisions and episode completion
        if step == max_steps - 1:
            done['__all__'] = True
        if any(is_collision(a) for a in obs):
            collision = True

Esempio n. 2

Mostra file

lib_dir = os.path.abspath(os.path.join(path, os.pardir))
sys.path.insert(1,lib_dir) 

from dqn.agent import Agent

ENV_NAME = 'Humanoid-v2'
env = gym.make(ENV_NAME)

np.random.seed(0)
env.seed(0)
nb_actions = 17
agent = Agent(state_size=376, action_size=17, seed=0)

agent.qnetwork_local.load_state_dict(torch.load('checkpoint.pth'))

for i in range(15):
    state = env.reset()
    while True: 
        env.render()
        action = agent.act(state)
        state, reward, done, _ = env.step(action)
        print(reward)
        if done:
            break 
    print("Iteration ",i)
            
env.close()