Python GridworldBase.true_values_for_sample примеры использования

Язык программирования: Python

Пространство имен/Пакет: ml.rl.test.gridworld.gridworld_base

Класс/Тип: GridworldBase

Метод/Функция: true_values_for_sample

Примеров на hotexamples.com: 3

Python GridworldBase.true_values_for_sample - 3 примера найдено. Это лучшие примеры Python кода для ml.rl.test.gridworld.gridworld_base.GridworldBase.true_values_for_sample, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

true_values_for_sample(2)

possible_next_actions(1)

step(1)

transition_probabilities(1)

true_rewards_for_sample(1)

Пример #1

Показать файл

Файл: gridworld_continuous.py Проект: weiddeng/Horizon

 def true_values_for_sample(self, states, actions, assume_optimal_policy: bool):
     string_actions = []
     for action in actions:
         string_actions.append(self.features_to_action(action))
     return GridworldBase.true_values_for_sample(
         self, states, string_actions, assume_optimal_policy
     )

Пример #2

Показать файл

Файл: gridworld_continuous.py Проект: sra4077/Horizon

 def true_values_for_sample(self, states, actions, assume_optimal_policy: bool):
     string_actions = []
     for action in actions:
         string_actions.append(self.features_to_action(action))
     return GridworldBase.true_values_for_sample(
         self, states, string_actions, assume_optimal_policy
     )

Пример #3

Показать файл

Файл: gridworld_continuous.py Проект: caozhengquan/BlueWhale

 def true_values_for_sample(self, states, actions,
                            assume_optimal_policy: bool):
     string_actions = []
     for action in actions:
         string_actions.append(self.ACTIONS[int(list(action.keys())[0]) -
                                            self.num_states])
     return GridworldBase.true_values_for_sample(self, states,
                                                 string_actions,
                                                 assume_optimal_policy)