Python State.pieces_array примеры использования

Язык программирования: Python

Пространство имен/Пакет: game

Класс/Тип: State

Метод/Функция: pieces_array

Примеров на hotexamples.com: 3

Python State.pieces_array - 3 примера найдено. Это лучшие примеры Python кода для game.State.pieces_array, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

State(30)

is_done(30)

next(30)

legal_actions(24)

is_first_player(20)

is_lose(14)

position_to_action(4)

next_state(3)

get_state(3)

pieces_array(3)

get_available_actions(3)

terminal(3)

tick_time(3)

total_time(3)

opponent(2)

put_obstacles(2)

update(2)

make_move(2)

whiteDisplay(2)

generateActionFromString(2)

blackDisplay(2)

get_state_result(2)

get_next_state(2)

gameOver(2)

leader(1)

board(1)

copy(1)

step(1)

sid(1)

show_board(1)

get_cell(1)

put_center(1)

apply_moves(1)

players(1)

player_name(1)

play_move(1)

get_legal_moves(1)

piece_count(1)

initialise(1)

is_player_won(1)

legal_move(1)

Пример #1

Показать файл

def play(model):
    # 学習データ
    history = []

    # 状態の生成
    state = State()

    while True:
        # ゲーム終了時
        if state.is_done():
            break

        # 合法手の確率分布の取得
        scores = pv_mcts_scores(model, state, SP_TEMPERATURE)

        # 学習データに状態と方策を追加
        policies = [0] * DN_OUTPUT_SIZE
        for action, policy in zip(state.legal_actions(), scores):
            policies[action] = policy
        history.append([state.pieces_array(), policies, None])

        # 行動の取得
        action = np.random.choice(state.legal_actions(), p=scores)

        # 次の状態の取得
        state = state.next(action)

    # 学習データに価値を追加
    value = first_player_value(state)
    for i in range(len(history)):
        history[i][2] = value
        value = -value
    return history

Пример #2

Показать файл

Файл: self_play.py Проект: myzk-a/doubutu-syougi

def play(model):
  history = []

  state = State()

  while True:
    if state.is_done():
      break
    
    scores = pv_mcts_scores(model, state, SP_TEMPERATURE)
    policies = [0] * DN_OUTPUT_SIZE
    for action, policy in zip(state.legal_actions(), scores):
      policies[action] = policy
    history.append([state.pieces_array(), policies, None])

    action = np.random.choice(state.legal_actions(), p=scores)

    state = state.next(action)

  value = first_player_value(state)
  for i in range(len(history)):
    history[i][2] = value
    value = -value
  
  return history

Пример #3

Показать файл

Файл: self_play.py Проект: Gil-jung/DSBookStudy

def play(model):
    # 학습 데이터
    history = []

    # 상태 생성
    state = State()

    while True:
        # 게임 종료 시
        if state.is_done():
            break

        # 합법적인 수의 확률 분포 얻기
        scores = pv_mcts_scores(model, state, SP_TEMPERATURE)

        # 학습 데이터에 상태와 정책 추가
        policies = [0] * DN_OUTPUT_SIZE
        for action, policy in zip(state.legal_actions(), scores):
            policies[action] = policy
        history.append([state.pieces_array(), policies, None])

        # 행동 얻기
        action = np.random.choice(state.legal_actions(), p=scores)

        # 다음 상태 얻기
        state = state.next(action)

        # 학습 데이터에 가치 추가
    value = first_player_value(state)
    for i in range(len(history)):
        history[i][2] = value
        value = -value
    return history