Python Action 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rlglued.types

클래스/타입: Action

hotexamples.com에서의 예제들: 5

Python Action - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rlglued.types.Action에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

intArray(4)

from_AbstractType(1)

예제 #1

파일 보기

파일: sample_sarsa_agent.py 프로젝트: evenmarbles/rlglued

    def start(self, observation):
        state = observation.intArray[0]
        action = self.egreedy(state)
        return_action = Action()
        return_action.intArray = [action]

        self.lastAction = copy.deepcopy(return_action)
        self.lastObservation = copy.deepcopy(observation)

        return return_action

예제 #2

파일 보기

파일: skeletonagent.py 프로젝트: evenmarbles/rlglued

    def step(self, reward, observation):
        # Generate random action, 0 or 1
        int_action = self.rand_generator.randint(0, 1)
        return_action = Action()
        return_action.intArray = [int_action]

        last_action = copy.deepcopy(return_action)
        last_observation = copy.deepcopy(observation)

        return return_action

예제 #3

파일 보기

파일: casmlagent.py 프로젝트: evenmarbles/rlpy

    def choose_action(self):
        pi_s = self._learner.policy(self._laststate)

        lastaction = pi_s.policy_action
        pi_s = lastaction.policy(self._laststate)

        self._lastaction = lastaction
        assert self._lastaction
        # print(lastaction)

        return_action = Action()
        return_action.intArray = self._lastaction.tolist()
        return return_action

예제 #4

파일 보기

파일: sample_sarsa_agent.py 프로젝트: evenmarbles/rlglued

    def step(self, reward, observation):
        state = observation.intArray[0]
        last_state = self.lastObservation.intArray[0]
        last_action = self.lastAction.intArray[0]

        action = self.egreedy(state)

        Q_sa = self.value_function[last_state][last_action]
        Q_sprime_aprime = self.value_function[state][action]

        new_Q_sa = Q_sa + self.sarsa_stepsize * (reward + self.sarsa_gamma * Q_sprime_aprime - Q_sa)

        if not self.policyFrozen:
            self.value_function[last_state][last_action] = new_Q_sa

        return_action = Action()
        return_action.intArray = [action]

        self.lastAction = copy.deepcopy(return_action)
        self.lastObservation = copy.deepcopy(observation)

        return return_action

예제 #5

파일 보기

파일: network.py 프로젝트: evenmarbles/rlglued

 def get_Action(self):
     return Action.from_AbstractType(self.get_AbstractType())