Python Reward_observation_action_terminal.o 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rlglued.types

클래스/타입: Reward_observation_action_terminal

메소드/함수: o

hotexamples.com에서의 예제들: 2

Python Reward_observation_action_terminal.o - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rlglued.types.Reward_observation_action_terminal.o에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

a(2)

o(2)

r(2)

terminal(2)

converged(1)

자주 사용되는 메소드들

a (2)

o (2)

r (2)

terminal (2)

converged (1)

예제 #1

파일 보기

파일: rlglue.py 프로젝트: evenmarbles/rlglued

 def step(self):
     self.do_call_with_no_params(network.kRLStep)
     self.do_standard_recv(network.kRLStep)
     roat = Reward_observation_action_terminal()
     roat.terminal = self._network.get_int()
     roat.r = self._network.get_double()
     roat.o = self._network.get_Observation()
     roat.a = self._network.get_Action()
     return roat

예제 #2

파일 보기

파일: rlglue.py 프로젝트: evenmarbles/rlglued

    def step(self):
        if self._prevact is None:
            self.start()

        rot = self._env.step(self._prevact)

        roat = Reward_observation_action_terminal()
        roat.o = rot.o
        roat.r = rot.r
        roat.terminal = rot.terminal

        self._total_reward += rot.r

        if rot.terminal == 1:
            self._episode_count += 1
            converged = self._agent.end(rot.r)
            roat.converged = converged if converged is not None else 0
            self._prevact = None
        else:
            self._step_count += 1
            self._prevact = self._agent.step(rot.r, rot.o)
            roat.a = self._prevact

        return roat