Exemplos de ConstantReward.get_reward em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: edge.reward

Classe / Tipo: ConstantReward

Método / Função: get_reward

Exemplos em hotexamples.com: 2

ConstantReward.get_reward em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de edge.reward.ConstantReward.get_reward em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

ConstantReward(9)

get_reward(2)

Métodos Frequentes

ConstantReward (9)

get_reward (2)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: reward_test.py Projeto: sheim/edge

def test_constant(self): space = StateActionSpace(*Box(0, 1, (10, 10)).sets) reward = ConstantReward(space, 10) total = 0 for t in range(10): s, a = space.get_tuple(space.sample()) total += reward.get_reward(s, a, space.state_space.sample(), False) self.assertEqual(total, 100)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: reward_test.py Projeto: sheim/edge

def test_unrewarded(self): space = StateActionSpace(*Box(0, 1, (10, 10)).sets) # `rewarded` should be a Subspace, but this is not implemented yet rewarded = StateActionSpace(*Box([0, 0], [0.5, 0.5], (10, 10)).sets) unrewarded = StateActionSpace(*Box([0.5, 0.5], [1, 1], (10, 10)).sets) reward = ConstantReward(space, 10, unrewarded_set=unrewarded) total = 0 for t in range(10): s, a = space.get_tuple(space.sample()) sampled_space = rewarded.state_space if t % 2 == 0 \ else unrewarded.state_space total += reward.get_reward(s, a, sampled_space.sample(), False) self.assertEqual(total, 50)