Python Agent示例

编程语言: Python

命名空间/包名称: pl_bolts.models.rl.common.agents

类/类型: Agent

hotexamples.com的示例: 7

Python Agent - 已找到7个示例。这些是从开源项目中提取的最受好评的pl_bolts.models.rl.common.agents.Agent现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Agent(7)

常用方法

Agent (7)

示例#1

显示文件

文件： test_reinforce.py 项目： zcain117/pytorch-lightning-bolts

    def setUp(self) -> None:
        self.env = ToTensor(gym.make("CartPole-v0"))
        self.obs_shape = self.env.observation_space.shape
        self.n_actions = self.env.action_space.n
        self.net = MLP(self.obs_shape, self.n_actions)
        self.agent = Agent(self.net)
        self.xp_stream = EpisodicExperienceStream(self.env,
                                                  self.agent,
                                                  Mock(),
                                                  episodes=4)
        self.rl_dataloader = DataLoader(self.xp_stream)

        parent_parser = argparse.ArgumentParser(add_help=False)
        parent_parser = cli.add_base_args(parent=parent_parser)
        parent_parser = DQN.add_model_specific_args(parent_parser)
        args_list = [
            "--algo",
            "dqn",
            "--warm_start_steps",
            "500",
            "--episode_length",
            "100",
        ]
        self.hparams = parent_parser.parse_args(args_list)
        self.model = Reinforce(**vars(self.hparams))

示例#2

显示文件

文件： test_experience_sources.py 项目： vladisai/pytorch-lightning-bolts

 def setUp(self) -> None:
     self.env = gym.make("CartPole-v0")
     self.net = Mock()
     self.agent = Agent(self.net)
     self.xp_stream = EpisodicExperienceStream(self.env,
                                               self.agent,
                                               torch.device('cpu'),
                                               episodes=4)
     self.rl_dataloader = DataLoader(self.xp_stream)

示例#3

显示文件

    def setUp(self) -> None:
        self.env = ToTensor(gym.make("CartPole-v0"))
        self.obs_shape = self.env.observation_space.shape
        self.n_actions = self.env.action_space.n
        self.net = MLP(self.obs_shape, self.n_actions)
        self.agent = Agent(self.net)

        parent_parser = argparse.ArgumentParser(add_help=False)
        parent_parser = VanillaPolicyGradient.add_model_specific_args(parent_parser)
        args_list = [
            "--env", "CartPole-v0",
            "--batch_size", "32"
        ]
        self.hparams = parent_parser.parse_args(args_list)
        self.model = VanillaPolicyGradient(**vars(self.hparams))

示例#4

显示文件

文件： test_reinforce.py 项目： supadupa/pytorch-lightning-bolts

    def setUp(self) -> None:
        self.env = ToTensor(gym.make("CartPole-v0"))
        self.obs_shape = self.env.observation_space.shape
        self.n_actions = self.env.action_space.n
        self.net = MLP(self.obs_shape, self.n_actions)
        self.agent = Agent(self.net)
        self.exp_source = DiscountedExperienceSource(self.env, self.agent)

        parent_parser = argparse.ArgumentParser(add_help=False)
        parent_parser = Reinforce.add_model_specific_args(parent_parser)
        args_list = [
            "--env", "CartPole-v0", "--batch_size", "32", "--gamma", "0.99"
        ]
        self.hparams = parent_parser.parse_args(args_list)
        self.model = Reinforce(**vars(self.hparams))

        self.rl_dataloader = self.model.train_dataloader()

示例#5

显示文件

文件： test_agents.py 项目： limberc/lightning-bolts

 def test_base_agent(self):
     agent = Agent(self.net)
     action = agent(self.state, "cuda:0")
     self.assertIsInstance(action, list)

示例#6

显示文件

 def setUp(self) -> None:
     self.env = ToTensor(gym.make("CartPole-v0"))
     self.net = Mock()
     self.agent = Agent(self.net)
     self.xp_stream = EpisodicExperienceStream(self.env, self.agent, device=Mock(), episodes=4)
     self.rl_dataloader = DataLoader(self.xp_stream)

示例#7

显示文件

文件： test_agents.py 项目： zcain117/pytorch-lightning-bolts

 def test_base_agent(self):
     agent = Agent(self.net)
     action = agent(self.state, 'cuda:0')
     self.assertIsInstance(action, int)