Python ReinforcementDataSet.ReinforcementDataSet示例

编程语言: Python

命名空间/包名称: pybrain.datasets

方法/功能: ReinforcementDataSet

hotexamples.com的示例: 4

Python ReinforcementDataSet.ReinforcementDataSet - 已找到4个示例。这些是从开源项目中提取的最受好评的pybrain.datasets.ReinforcementDataSet.ReinforcementDataSet现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ReinforcementDataSet(4)

addSample(4)

clear(4)

newSequence(3)

示例#1

显示文件

 def __init__(self, net, task, valueNetwork=None, **args):
     self.net = net
     self.task = task
     self.setArgs(**args)
     if self.valueLearningRate == None:
         self.valueLearningRate = self.learningRate
     if self.valueMomentum == None:
         self.valueMomentum = self.momentum        
     if self.supervisedPlotting:
         from pylab import ion
         ion() 
     
     # adaptive temperature:
     self.tau = 1.
     
     # prepare the datasets to be used
     self.weightedDs = ImportanceDataSet(self.task.outdim, self.task.indim)
     self.rawDs = ReinforcementDataSet(self.task.outdim, self.task.indim)
     self.valueDs = SequentialDataSet(self.task.outdim, 1)
     
     # prepare the supervised trainers
     self.bp = BackpropTrainer(self.net, self.weightedDs, self.learningRate,
                               self.momentum, verbose=False,
                               batchlearning=True)            
     
     # CHECKME: outsource
     self.vnet = valueNetwork
     if valueNetwork != None:
         self.vbp = BackpropTrainer(self.vnet, self.valueDs, self.valueLearningRate,
                                    self.valueMomentum, verbose=self.verbose)
         
     # keep information:
     self.totalSteps = 0
     self.totalEpisodes = 0

示例#2

显示文件

    def __init__(self, indim, outdim):
        # store input and output dimension
        self.indim = indim
        self.outdim = outdim

        # create the history dataset
        self.history = ReinforcementDataSet(indim, outdim)

示例#3

显示文件

文件： history.py 项目： chenzhikuo1/OCR-Python

    def __init__(self, indim, outdim):        
        # store input and output dimension
        self.indim = indim
        self.outdim = outdim
                
        # create history dataset
        self.remember = True
        self.history = ReinforcementDataSet(indim, outdim)

        # initialize temporary variables
        self.lastobs = None
        self.lastaction = None

示例#4

显示文件

文件： q.py 项目： jaegs/AI_Practicum

 def __init__(self, ):
     Q.__init__(self, const.ALPHA, const.GAMMA)
     self.explorer = FeasibleEpsilonGreedyExplorer(const.EPSILON, const.DECAY)
     self.dataset2 = ReinforcementDataSet(1, 1)