Python ValueAgent.get_action 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pl_bolts.models.rl.common.agents

클래스/타입: ValueAgent

메소드/함수: get_action

hotexamples.com에서의 예제들: 2

Python ValueAgent.get_action - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pl_bolts.models.rl.common.agents.ValueAgent.get_action에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ValueAgent(5)

get_action(2)

get_random_action(2)

update_epsilon(2)

예제 #1

파일 보기

파일: test_agents.py 프로젝트: zcain117/pytorch-lightning-bolts

class TestValueAgent(TestCase):
    def setUp(self) -> None:
        self.env = gym.make("CartPole-v0")
        self.net = Mock(return_value=torch.Tensor([[0.0, 100.0]]))
        self.state = torch.tensor(self.env.reset())
        self.device = self.state.device
        self.value_agent = ValueAgent(self.net, self.env.action_space.n)

    def test_value_agent(self):

        action = self.value_agent(self.state, self.device)
        self.assertIsInstance(action, int)

    def test_value_agent_GET_ACTION(self):
        action = self.value_agent.get_action(self.state, self.device)
        self.assertIsInstance(action, int)
        self.assertEqual(action, 1)

    def test_value_agent_RANDOM(self):
        action = self.value_agent.get_random_action()
        self.assertIsInstance(action, int)

예제 #2

파일 보기

파일: test_agents.py 프로젝트: limberc/lightning-bolts

class TestValueAgent(TestCase):
    def setUp(self) -> None:
        self.env = gym.make("CartPole-v0")
        self.net = Mock(return_value=Tensor([[0.0, 100.0]]))
        self.state = [self.env.reset()]
        self.device = torch.device(
            "cuda" if torch.cuda.is_available() else "cpu")
        self.value_agent = ValueAgent(self.net, self.env.action_space.n)

    def test_value_agent(self):

        action = self.value_agent(self.state, self.device)
        self.assertIsInstance(action, list)
        self.assertIsInstance(action[0], int)

    def test_value_agent_get_action(self):
        action = self.value_agent.get_action(self.state, self.device)
        self.assertIsInstance(action, np.ndarray)
        self.assertEqual(action[0], 1)

    def test_value_agent_random(self):
        action = self.value_agent.get_random_action(self.state)
        self.assertIsInstance(action[0], int)