Python TabularPolicy примеры использования

Язык программирования: Python

Пространство имен/Пакет: pyspiel

Метод/Функция: TabularPolicy

Примеров на hotexamples.com: 2

Python TabularPolicy - 2 примера найдено. Это лучшие примеры Python кода для pyspiel.TabularPolicy, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: policy.py Проект: rickyHong/open_spiel-repl

def python_policy_to_pyspiel_policy(python_tabular_policy):
  """Converts a TabularPolicy to a pyspiel.TabularPolicy."""
  infostates_to_probabilities = dict()
  for infostate in python_tabular_policy.state_lookup:
    probs = python_tabular_policy.policy_for_key(infostate)
    infostates_to_probabilities[infostate] = list(enumerate(probs))
  return pyspiel.TabularPolicy(infostates_to_probabilities)

Пример #2

Показать файл

def python_policy_to_pyspiel_policy(python_tabular_policy):
    """Converts a TabularPolicy to a pyspiel.TabularPolicy."""
    infostates_to_probabilities = dict()
    for infostate, index in python_tabular_policy.state_lookup.items():
        probs = python_tabular_policy.action_probability_array[index]
        legals = python_tabular_policy.legal_actions_mask[index]

        action_probs = []
        for action, (prob, is_legal) in enumerate(zip(probs, legals)):
            if is_legal == 1:
                action_probs.append((action, prob))
        infostates_to_probabilities[infostate] = action_probs
    return pyspiel.TabularPolicy(infostates_to_probabilities)