Python conv_statusの例

プログラミング言語: Python

名前空間/パッケージ名: codelog.tensorflow.tictactoe.dlplayer

メソッド/関数: conv_status

hotexamples.comのコード掲載数: 6

Python conv_status - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのcodelog.tensorflow.tictactoe.dlplayer.conv_statusの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

    def turn_end(self, status):
        if self.train_enable:
            if self.last_choice != None:
                if status.actor == None:
                    reward = REWARD_WIN if status.winner == self.side \
                        else REWARD_DRAW if status.winner == None \
                        else REWARD_LOSE
                    train_dict = copy.copy(self.train_dict)
                    train_dict['state_1'] = train_dict['state_0']
                    train_dict['cont'] = 0
                    train_dict['reward_1'] = reward
                    self.dl.push_train_dict(train_dict)
                    self.dl.do_train()
                else:
                    new_status = dlplayer.conv_status(status,
                                                      tttl.OPP[self.side])
                    train_dict = copy.copy(self.train_dict)
                    train_dict['state_1'] = new_status
                    train_dict['cont'] = 1
                    train_dict['reward_1'] = REWARD_STEP
                    self.dl.push_train_dict(train_dict)
                    self.dl.do_train()

        self.legit_mask = None
        self.train_dict = None
        self.last_choice = None

コード例 #2

ファイルを表示

ファイル: deeplearn0007.py プロジェクト: luzi82/codelog.tensorflow.tictactoe

    def turn_end(self,status):
        if self.train_enable:
            if self.last_choice != None:
                if status.actor == None:
                    reward = REWARD_WIN if status.winner == self.side \
                        else REWARD_DRAW if status.winner == None \
                        else REWARD_LOSE
                    train_dict = copy.copy(self.train_dict)
                    train_dict['state_1'] = train_dict['state_0']
                    train_dict['cont'] = 0
                    train_dict['reward_1'] = reward
                    self.dl.push_train_dict(train_dict)
                    self.dl.do_train()
                else:
                    new_status = dlplayer.conv_status(status,tttl.OPP[self.side])
                    train_dict = copy.copy(self.train_dict)
                    train_dict['state_1'] = new_status
                    train_dict['cont'] = 1
                    train_dict['reward_1'] = REWARD_STEP
                    self.dl.push_train_dict(train_dict)
                    self.dl.do_train()

        self.legit_mask = None
        self.train_dict = None
        self.last_choice = None

コード例 #3

ファイルを表示

ファイル: deeplearn0006.py プロジェクト: luzi82/codelog.tensorflow.tictactoe

    def input(self, status, retry):
        if not retry:
            self.legit_mask = [1.0] * 9
            self.train_dict = None
            self.last_choice = None
        else:
            self.legit_mask[self.last_choice] = 0.0
            if self.train_enable:
                if self.train_dict != None:
                    train_dict = copy.copy(self.train_dict)
                    train_dict['state_1'] = train_dict['state_0']
                    train_dict['cont'] = 0
                    train_dict['reward_1'] = REWARD_BAD
                    self.dl.push_train_dict(train_dict)
                    self.dl.do_train()

        new_status = dlplayer.conv_status(status, self.side)
        self.train_dict, _ = self.dl.cal_choice(new_status, self.legit_mask,
                                                self.train_enable)

        choice = self.train_dict['choice_0']
        print("GKPMPCLI choice: " + str(choice))

        self.last_choice = choice
        return dlplayer.ACTION_MAP[choice]

コード例 #4

ファイルを表示

ファイル: deeplearn0017.py プロジェクト: luzi82/codelog.tensorflow.tictactoe

    def input(self,status):
        if self.legit_mask == None:
            self.legit_mask = [1.0]*9

        new_status = dlplayer.conv_status(status,self.side)
        self.train_dict, _ = self.dl.cal_choice(new_status,self.legit_mask,self.train_enable)
        
        choice = self.train_dict['choice_0']
        logging.debug("GKPMPCLI choice: "+str(choice))

        self.last_choice = choice
        return dlplayer.ACTION_MAP[choice]

コード例 #5

ファイルを表示

ファイル: deeplearn0021.py プロジェクト: luzi82/codelog.tensorflow.tictactoe

    def input(self,status):
        if self.legit_mask == None:
            self.legit_mask = [1.0]*9

        new_status = dlplayer.conv_status(status,self.side)
        self.train_dict, _ = self.dl.cal_choice(new_status,self.legit_mask,self.train_enable)
        
        choice = self.train_dict['choice_0']
        logging.debug("GKPMPCLI choice: "+str(choice))

        self.last_choice = choice
        return dlplayer.ACTION_MAP[choice]

コード例 #6

ファイルを表示

ファイル: deeplearn0007.py プロジェクト: luzi82/codelog.tensorflow.tictactoe

    def input(self,status,retry):
        if not retry:
            self.legit_mask = [1.0]*9
            self.train_dict = None
            self.last_choice = None
        else:
            self.legit_mask[self.last_choice] = 0.0
            if self.train_enable:
                if self.train_dict != None:
                    train_dict = copy.copy(self.train_dict)
                    train_dict['state_1'] = train_dict['state_0']
                    train_dict['cont'] = 0
                    train_dict['reward_1'] = REWARD_BAD
                    self.dl.push_train_dict(train_dict)
                    self.dl.do_train()

        new_status = dlplayer.conv_status(status,self.side)
        self.train_dict, _ = self.dl.cal_choice(new_status,self.legit_mask,self.train_enable)
        
        choice = self.train_dict['choice_0']
        print("GKPMPCLI choice: "+str(choice))

        self.last_choice = choice
        return dlplayer.ACTION_MAP[choice]