Python TabularPolicy 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pyspiel

메소드/함수: TabularPolicy

hotexamples.com에서의 예제들: 2

Python TabularPolicy - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pyspiel.TabularPolicy에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: policy.py 프로젝트: rickyHong/open_spiel-repl

def python_policy_to_pyspiel_policy(python_tabular_policy):
  """Converts a TabularPolicy to a pyspiel.TabularPolicy."""
  infostates_to_probabilities = dict()
  for infostate in python_tabular_policy.state_lookup:
    probs = python_tabular_policy.policy_for_key(infostate)
    infostates_to_probabilities[infostate] = list(enumerate(probs))
  return pyspiel.TabularPolicy(infostates_to_probabilities)

예제 #2

파일 보기

def python_policy_to_pyspiel_policy(python_tabular_policy):
    """Converts a TabularPolicy to a pyspiel.TabularPolicy."""
    infostates_to_probabilities = dict()
    for infostate, index in python_tabular_policy.state_lookup.items():
        probs = python_tabular_policy.action_probability_array[index]
        legals = python_tabular_policy.legal_actions_mask[index]

        action_probs = []
        for action, (prob, is_legal) in enumerate(zip(probs, legals)):
            if is_legal == 1:
                action_probs.append((action, prob))
        infostates_to_probabilities[infostate] = action_probs
    return pyspiel.TabularPolicy(infostates_to_probabilities)