Python Reversi.isEnd 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: Reversi

클래스/타입: Reversi

메소드/함수: isEnd

hotexamples.com에서의 예제들: 4

Python Reversi.isEnd - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 Reversi.Reversi.isEnd에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Reversi(4)

isEnd(4)

get_score(3)

update(3)

winner(3)

game(2)

get_enables(2)

initiateboard(2)

get_init_board(1)

get_player(1)

getEnables(1)

get_stone_num(1)

assigntile(1)

is_end_board(1)

is_putable(1)

is_win_game(1)

print_screen(1)

put(1)

reset(1)

doFlip(1)

예제 #1

파일 보기

파일: train.py 프로젝트: tamao3/tf-dqn-reversi

                                if win == playerID[j]:
                                    # 勝ったら報酬1を得る
                                    reword = 1

                            players[j].store_experience(
                                state, targets, tr, reword, state_X, target_X,
                                end)
                            players[j].experience_replay()

                    # 行動を選択
                    action = players[i].select_action(state, targets,
                                                      players[i].exploration)
                    # 行動を実行
                    env.update(action, playerID[i])
                    # for log
                    loss = players[i].current_loss
                    Q_max, Q_action = players[i].select_enable_action(
                        state, targets)
                    print(
                        "player:{:1d} | pos:{:2d} | LOSS: {:.4f} | Q_MAX: {:.4f}"
                        .format(playerID[i], action, loss, Q_max))

                # 行動を実行した結果
                terminal = env.isEnd()

        w = env.winner()
        print("EPOCH: {:03d}/{:03d} | WIN: player{:1d}".format(e, n_epochs, w))

    # 保存は後攻のplayer2 を保存する。
    players[1].save_model()

예제 #2

파일 보기

            for i in range(0, 2):
                state = env.screen  # 현재 보드판의 상태(배열)을 가져옴
                targets = env.getEnables(
                    playerID[i])  # 배열(플레이어가 둘 수 있는 위치를 가짐)을 가져옴

                if len(targets) > 0:  # 어딘가에 둘 수 있는 장소가있는 경우
                    # 행동을 선택
                    action = players[i].selectAction(state, targets,
                                                     1 / ((e / 10) + 1))

                    # 행동을 실행
                    env.doFlip([action // 8, action % 8], playerID[i])

                    # 종료 판정
                    win = env.winner()  # 현재 유리한 플레이어
                    end = env.isEnd()

                    # 다음 상태
                    state_X = env.screen
                    target_X = env.getEnables(playerID[i + 1])
                    if len(target_X) == 0:
                        target_X = env.getEnables(playerID[i])

                    reward = 0
                    if end == True:
                        reward = 1

                    players[i].storeExperience(state, targets, action, reward,
                                               state_X, target_X, end)

                    # for log

예제 #3

파일 보기

파일: FightWithAI.py 프로젝트: XxAC130xX/dqn

    # args
    parser = argparse.ArgumentParser()
    parser.add_argument("-m", "--model_path")
    parser.add_argument("-s", "--save", dest="save", action="store_true")
    parser.set_defaults(save=False)
    args = parser.parse_args()

    # environmet, agent
    env = Reversi()
    agent = DQNAgent(env.enable_actions, env.name, env.screen_n_rows,
                     env.screen_n_cols)
    agent.load_model("models1/Reversi.ckpt")

    # game
    print("------------- GAME START ---------------")
    while not env.isEnd():
        print("*** userターン○ ***")
        env.print_screen()
        enables = env.get_enables(1)
        if len(enables) > 0:
            flg = False
            while not flg:
                print("番号を入力してください")
                print(enables)
                inp = input('>>>  ')
                action_t = int(inp)
                for i in enables:
                    if action_t == i:
                        flg = True
                        break

예제 #4

파일 보기

    parser.set_defaults(save=False)
    args = parser.parse_args()

    # environmet, agent
    env = Reversi()
    agent1 = DQNAgent(env.enable_actions, env.name, env.screen_n_rows,
                      env.screen_n_cols)
    agent1.load_model("models1/Reversi.ckpt")

    agent2 = DQNAgent(env.enable_actions, env.name, env.screen_n_rows,
                      env.screen_n_cols)
    agent2.load_model("models2/Reversi.ckpt")

    # game
    print("------------- GAME START ---------------")
    while not env.isEnd():
        # print("*** userターン○ ***")
        # env.print_screen()
        # enables = env.get_enables(1)
        # if len(enables) > 0:
        #     flg = False
        #     while not flg:
        #         print("番号を入力してください")
        #         print(enables)
        #         inp = input('>>>  ')
        #         action_t = int(inp)
        #         for i in enables:
        #             if action_t == i:
        #                 flg = True
        #                 break