Python EligibilityTraces.EligibilityTraces 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: eligibility_traces

클래스/타입: EligibilityTraces

메소드/함수: EligibilityTraces

hotexamples.com에서의 예제들: 5

Python EligibilityTraces.EligibilityTraces - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 eligibility_traces.EligibilityTraces.EligibilityTraces에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

EligibilityTraces(5)

iteritems(2)

update_all(2)

decay(1)

get(1)

increment(1)

예제 #1

파일 보기

파일: learning_agents.py 프로젝트: switchfootsid/playing_atari

 def __init__(self, actions, discount, featureExtractor, explorationProb,
              stepSize, threshold, decay, maxGradient,
              num_consecutive_random_actions):
     """
     :note: please see parent class for params not described here
     """
     super(SARSALambdaLearningAlgorithm,
           self).__init__(actions, discount, featureExtractor,
                          explorationProb, stepSize, maxGradient,
                          num_consecutive_random_actions)
     self.eligibility_traces = EligibilityTraces(threshold, decay)

예제 #2

파일 보기

파일: learning_agents.py 프로젝트: marioyc/RL-algorithms

 def __init__(self, actions, featureExtractor, discount, explorationProb,
              stepSize, decay, threshold):
     super(SARSALambdaLearningAlgorithm,
           self).__init__(actions, featureExtractor, discount,
                          explorationProb, stepSize)
     self.threshold = threshold
     self.decay = decay
     self.eligibility_traces = EligibilityTraces(threshold, decay)
     self.name = "SARSALambda"
     self.maxFeatVectorNorm = 1
     self.firstReward = 0
     self.sawFirst = False

예제 #3

파일 보기

파일: main.py 프로젝트: tharmoth/MountainCart

from q_learning import QLearning
from SARSA import SARSALearning
from eligibility_traces import EligibilityTraces
from function_approximation import FApprox
from mountain_cart import run_methods, self_iterate
import pickle

if __name__ == "__main__":
    # Initialize a method
    methods = [
        QLearning("MountainCar-v0", print_progress=False),
        SARSALearning("MountainCar-v0", print_progress=False),
        FApprox("MountainCar-v0", print_progress=False),
        EligibilityTraces("MountainCar-v0", print_progress=False)
    ]

    # Run the tests
    run_methods(methods)

    method = methods[0]
    method.q_table = pickle.load(
        open("Best_Method_" + str(type(method).__name__) + ".p", "rb"))
    method.evaluate()
    method.display()

    self_iterate(methods[0])

예제 #4

파일 보기

파일: learning_agents.py 프로젝트: marioyc/RL-algorithms

 def resetTraces(self):
     self.eligibility_traces = EligibilityTraces(self.threshold, self.decay)

예제 #5

파일 보기

파일: strategy.py 프로젝트: rohhenry/sarsa-lambda

 def new_episode(self):
     self.eligibility_traces = EligibilityTraces(1 - self.γ * self.λ)
     self.ε *= self.ε_decay
     self.episode += 1
     self.episode_reward = 0