Python Agent.actの例

プログラミング言語: Python

名前空間/パッケージ名: dqn.agent

クラス/型: Agent

メソッド/関数: act

hotexamples.comのコード掲載数: 2

Python Agent.act - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdqn.agent.Agent.actの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Agent(30)

play(23)

train(9)

predict(3)

get_action(3)

save_model(2)

act(2)

total_loss(2)

total_q(2)

observe(2)

update(2)

load(2)

inject_summary(2)

update_count(2)

save(2)

train_poison(1)

transfer_weights(1)

train_ep(1)

update_q_network(1)

test_video(1)

update_target_model(1)

step(1)

save_weight_to_pkl(1)

q_target(1)

reset(1)

randomplay(1)

q_eval(1)

play_poison(1)

play_mine(1)

play_image(1)

play2(1)

network_synchronize(1)

memorize(1)

load_weight_from_pkl(1)

init_for_stage(1)

exp_play(1)

e_greedy_action(1)

updated_target_q_network(1)

コード例 #1

ファイルを表示

    score, steps_taken, collision = 0, 0, False

    # Build initial observations for each agent
    for a in range(flags.num_agents):
        agent_obs[a] = normalize_observation(
            obs[a], flags.tree_depth, zero_center=flags.agent_type == 'dqn')
        agent_obs_buffer[a] = agent_obs[a].copy()

    # Run an episode
    for step in range(max_steps):
        update_values = [False] * flags.num_agents
        action_dict = {}

        for a in range(flags.num_agents):
            if info['action_required'][a]:
                action_dict[a] = agent.act(agent_obs[a], eps=eps)
                # action_dict[a] = np.random.randint(5)
                update_values[a] = True
                steps_taken += 1
            else:
                action_dict[a] = 0

        # Environment step
        obs, rewards, done, info = env.step(action_dict)
        score += sum(rewards.values()) / flags.num_agents

        # Check for collisions and episode completion
        if step == max_steps - 1:
            done['__all__'] = True
        if any(is_collision(a) for a in obs):
            collision = True

コード例 #2

ファイルを表示

lib_dir = os.path.abspath(os.path.join(path, os.pardir))
sys.path.insert(1,lib_dir) 

from dqn.agent import Agent

ENV_NAME = 'Humanoid-v2'
env = gym.make(ENV_NAME)

np.random.seed(0)
env.seed(0)
nb_actions = 17
agent = Agent(state_size=376, action_size=17, seed=0)

agent.qnetwork_local.load_state_dict(torch.load('checkpoint.pth'))

for i in range(15):
    state = env.reset()
    while True: 
        env.render()
        action = agent.act(state)
        state, reward, done, _ = env.step(action)
        print(reward)
        if done:
            break 
    print("Iteration ",i)
            
env.close()