Python Reward_observation_action_terminal 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rlglue.types

클래스/타입: Reward_observation_action_terminal

hotexamples.com에서의 예제들: 4

Python Reward_observation_action_terminal - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rlglue.types.Reward_observation_action_terminal에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Reward_observation_action_terminal(2)

a(2)

o(2)

r(2)

terminal(2)

예제 #1

파일 보기

파일: RLGlue.py 프로젝트: zydeon/rl-comp2014

def RL_step():
	roat = None
	doCallWithNoParams(Network.kRLStep)
	doStandardRecv(Network.kRLStep)
	roat = Reward_observation_action_terminal()
	roat.terminal = network.getInt()
	roat.r = network.getDouble()
	roat.o = network.getObservation()
	roat.a = network.getAction()
	return roat

예제 #2

파일 보기

파일: RLGlue.py 프로젝트: mayukhdas/rlproj

def RL_step():
	roat = None
	doCallWithNoParams(Network.kRLStep)
	doStandardRecv(Network.kRLStep)
	roat = Reward_observation_action_terminal()
	roat.terminal = network.getInt()
	roat.r = network.getDouble()
	roat.o = network.getObservation()
	roat.a = network.getAction()
	return roat

예제 #3

파일 보기

파일: RLGlueLocal.py 프로젝트: okkhoy/cd-rl

    def RL_step(self):
        if self.prevact is None:
            self.RL_start()
        self.step_count += 1
        rot = self.env.env_step(self.prevact)
        roat = Reward_observation_action_terminal()
        roat.terminal = rot.terminal
        self.exitStatus = rot.terminal

        if rot.terminal == 1:
            self.agent.agent_end(rot.r)
            roat.a = self.prevact
            self.prevact = None
        else:
            self.prevact = self.agent.agent_step(rot.r, rot.o)
            roat.a = self.prevact

        self.reward_return += rot.r
        roat.r = rot.r
        roat.o = rot.o
        return roat

예제 #4

파일 보기

파일: RLGlueLocal.py 프로젝트: AAHays/python-rl

	def RL_step(self):
		if self.prevact is None:
			self.RL_start()
		self.step_count += 1
		rot = self.env.env_step(self.prevact)
		roat = Reward_observation_action_terminal()
		roat.terminal = rot.terminal
		self.exitStatus = rot.terminal

		if rot.terminal == 1:
			self.agent.agent_end(rot.r)
			roat.a = self.prevact
			self.prevact = None
		else:
			self.prevact = self.agent.agent_step(rot.r, rot.o)
			roat.a = self.prevact

		self.reward_return += rot.r
		roat.r = rot.r
		roat.o = rot.o
		return roat