Python getState 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: cardDeck

메소드/함수: getState

hotexamples.com에서의 예제들: 5

Python getState - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 cardDeck.getState에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

0

파일 보기

파일: DeepMetroX.py 프로젝트: jhc660/MetroX_RL

    def make_move(self, board, cardDeck, gameEnd):
        self.state = board.getState() + cardDeck.getState()

        if gameEnd:
            new_state = board.getState() + cardDeck.getState()
            return new_state

        p = random.uniform(0, 1)
        if p < self.exp_factor:
            new_state = self.make_optimal_move(board, cardDeck)
        else:
            moves = board.getValidMoves()
            idx = random.choice(moves)
            board.makeMove(idx, cardDeck.currentCard)
            new_state = board.getState() + cardDeck.getState()
        return new_state

예제 #2

0

파일 보기

파일: DeepMetroX.py 프로젝트: jhc660/MetroX_RL

    def learn_state(self, board, cardDeck, gameEnd):

        state = board.getState() + cardDeck.getState()

        target = self.calc_target(board, cardDeck, gameEnd)

        self.train_model(target, 10)

        self.prev_state = state

예제 #3

0

파일 보기

파일: DeepMetroX.py 프로젝트: jhc660/MetroX_RL

    def make_optimal_move(self, board, cardDeck):
        moves = board.getValidMoves()
        if len(moves) == 1:
            board.makeMove(moves[0], cardDeck)
            return board.getState() + cardDeck.getState()

        temp_move_list = []
        v = -float('Inf')

        for idx in moves:

            v_temp = []
            temp_state = board.previewMove(idx, cardDeck.currentCard)

            simCardDraws = 50
            while simCardDraws > 0:
                simCardDraws -= 1
                temp_state_op = temp_state + cardDeck.previewNextCard()
                v_temp.append(self.calc_value(temp_state_op))

            # deletes Nones
            v_temp = list(filter(None.__ne__, v_temp))

            if len(v_temp) != 0:
                v_temp = np.average(v_temp)
            else:
                # encourage exploration
                v_temp = 50

            if v_temp > v:
                temp_move_list = [idx]
                v = v_temp
            elif v_temp == v:
                temp_move_list.append(idx)

        try:
            board.makeMove(random.choice(temp_move_list), cardDeck)
        except ValueError:
            print('temp state:', temp_state_list)
            raise Exception('temp state empty')

        return board.getState() + cardDeck.getState()

예제 #4

0

파일 보기

파일: DeepMetroX.py 프로젝트: jhc660/MetroX_RL

    def calc_target(self, board, cardDeck, gameEnd):
        v_s = self.calc_value(self.prev_state)

        R = self.reward(board)

        if gameEnd:
            v_s_tag = 0
        else:
            v_s_tag = self.calc_value(board.getState() + cardDeck.getState())

        target = np.array(v_s + self.alpha * (R + v_s_tag - v_s))

        return target

예제 #5

0

파일 보기

파일: DeepMetroX.py 프로젝트: jhc660/MetroX_RL

 def make_move(self, board, cardDeck, gameEnd):
     idx = int(input('Choose station number: '))
     board.makeMove(idx, cardDeck.currentCard)
     return board.getState() + cardDeck.getState()