コード例 #1
0
ファイル: pdm.py プロジェクト: jgbbarreiros/IASA-AR
 def politica(self, U):
     A, S = self._modelo.A, self._modelo.S
     PI = dict()
     for s in S():
         a_max = argmax(A(s), lambda a: self.util_accao(s, a, U))
         PI[s] = a_max
     return PI
コード例 #2
0
ファイル: pdm.py プロジェクト: Azkrath/AgentProspector
 def _politica(self, U):
     S, A = self._modelo.S, self._modelo.A
     PI = {}
     for s in S():
         PI[s] = argmax(A(s), lambda a: self._utilaccao(s, a, U))
     print(PI)
     return PI
コード例 #3
0
 def politica(self, modelo, U):
     #argMax e da psa e recebe o dominio de valores e a funcao, e pega em cada elemento do dominio e activa a funcao com esse elemtno,
     #calcular os valores todos e retornar o elemento que produziu os valores maiores
     S, A = modelo.S, modelo.A
     pol = {}
     for s in S():
         pol[s] = argmax(A(s), lambda a: self._util_accao(modelo, s, a, U))
     return pol
コード例 #4
0
ファイル: controloBDI.py プロジェクト: fredericoaf/AA2014
 def seleccionar_opcoes(self, opcoes):
     # ver as opcoes avaliar os planos
     # escolher a utilidade, que pode ser definida como constante ou calculada
     # sorted( lambda utilidade)
     if opcoes:
         criterio_avaliacao = lambda opcao: opcao.obter_utilidade()
         opcao_sel = argmax(opcoes, criterio_avaliacao)
         self.intencoes.append(opcao_sel)
コード例 #5
0
ファイル: mecanismo_sarsa.py プロジェクト: pepipe/ISEL
 def max_accao(self, s):
     shuffle(self.accoes)
     return argmax(self.accoes, lambda a:self.qval(s,a))
コード例 #6
0
ファイル: sel_accao.py プロジェクト: Azkrath/AgentProspector
 def _max_accao(self, s):
     return argmax(self._accoes, lambda a : self._mem_aprend[(s,a)])
コード例 #7
0
ファイル: wavefront.py プロジェクト: fredericoaf/AA2014
 def maxtrans(self, estado, modelo, V):
     trans = modelo.transicoes(estado)
     a, s = argmax( trans , lambda (a,s): V.get(s, 0))
     return a, s
コード例 #8
0
ファイル: q_learning.py プロジェクト: fredericoaf/AA2014
 def max_accao(self, s):
     # baralha a lista para garantir que nao corremos sempre a mesma lista
     shuffle( self.accoes)
     return argmax( self.accoes, lambda a: self.qval(s,a) )
コード例 #9
0
ファイル: sel_accao.py プロジェクト: jgbbarreiros/IASA-AR
 def max_accao(self, s):
     # selecionar a accao com melhor recompensa
     shuffle(self._accoes)
     return argmax(self._accoes, lambda a: self._mem_aprend[(s, a)])