Python Agent_DQN示例

编程语言: Python

命名空间/包名称: agent_dqn

类/类型: Agent_DQN

hotexamples.com的示例: 6

Python Agent_DQN - 已找到6个示例。这些是从开源项目中提取的最受好评的agent_dqn.Agent_DQN现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Agent_DQN(5)

train(4)

push(1)

示例#1

显示文件

def run(args):
    env = Environment('BreakoutNoFrameskip-v4',
                      args,
                      atari_wrapper=True,
                      test=True)
    from agent_dqn import Agent_DQN
    agent = Agent_DQN(env, args)
    test(agent, env, total_episodes=5)

示例#2

显示文件

文件： main.py 项目： AJ1897/DQN-Breakout

def run(args):
    if args.train_dqn:
        env_name = args.env_name or 'BreakoutNoFrameskip-v4'
        env = Environment(env_name, args, atari_wrapper=True)
        from agent_dqn import Agent_DQN
        agent = Agent_DQN(env, args)
        agent.train()

    if args.test_dqn:
        env = Environment('BreakoutNoFrameskip-v4', args, atari_wrapper=True, test=True)
        from agent_dqn import Agent_DQN
        agent = Agent_DQN(env, args)
        test(agent, env, total_episodes=100)

示例#3

显示文件

def run(args):
    if args.train_dqn:
        env_name = args.env_name or 'SEVN-Test-AllObs-Shaped-v1'
        env = gym.make(env_name)
        from agent_dqn import Agent_DQN
        agent = Agent_DQN(env, args)
        print("Device: ", device)
        print("n_heads: ", args.n_heads)
        agent.train()

    if args.test_dqn:
        current_time = '2020-12-22-00:03:03'
        env_name = args.env_name or 'SEVN-Test-AllObs-Shaped-v1'
        env = gym.make(env_name)
        from agent_dqn import Agent_DQN
        agent = Agent_DQN(env, args)
        test(agent, env, 10, current_time)

示例#4

显示文件

def run(args):
    if args.train_dqn:
        env_name = args.env_name or 'BreakoutNoFrameskip-v4'
        env = Environment(env_name, args, atari_wrapper=True)
        torch.set_default_tensor_type('torch.cuda.FloatTensor')
        from agent_dqn import Agent_DQN
        agent = Agent_DQN(env, args)
        agent.train()

    if args.test_dqn:
        env = Environment('BreakoutNoFrameskip-v4',
                          args,
                          atari_wrapper=True,
                          test=True)
        from agent_dqn import Agent_DQN
        agent = Agent_DQN(env, args)
        test(agent, env, total_episodes=100)

示例#5

显示文件

文件： Playground.py 项目： bucky1995/P3

    try:
        from argument import add_arguments
        parser = add_arguments(parser)
    except:
        pass
    args = parser.parse_args()
    return args


args = parse()
env = Environment('BreakoutNoFrameskip-v4', "", atari_wrapper=True, test=False)
n = env.action_space
state = env.reset()
device = torch.device("cpu")
input = torch.tensor(state, device=device)
agent = Agent_DQN(env, args)
dqn = DQN()
torch.save(dqn.state_dict(), "checkpoint.pth")
state_dict = torch.load("checkpoint.pth")

agent.train()
# Experience = namedtuple(
#             'Experience',
#             ('state','action','next_state','reward')
#         )
# e = Experience(state,action,next_state,reward)
# print(e)
# agent.train()

# print("shape:",input.shape)
#

示例#6

显示文件

文件： test_agent_dqn.py 项目： mahajanrevant/BreakoutRL

import argparse
#from test import test
from environment import Environment
from agent_dqn import Agent_DQN
from main import parse
from dqn_model import DQN
import torch



if __name__ == '__main__':
    args = parse()
    env_name = 'BreakoutNoFrameskip-v4'
    env = Environment(env_name, args, atari_wrapper=True)
    agent = Agent_DQN(env, args)
    print (agent.buffer)
    for i in range(0, 8):
        agent.push(i)
    print(agent.buffer)
    dqn = DQN()
    print(dqn)
    input = torch.randn(1, 4, 84, 84)
    out = dqn(input)
    print(out.size())