Python MDP.init 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: MDP

클래스/타입: MDP

메소드/함수: __init__

hotexamples.com에서의 예제들: 4

Python MDP.__init__ - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 MDP.MDP.__init__에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MDP(30)

getRewards(12)

probNextStates(12)

add_state(5)

get_action(5)

num_states(4)

get_action_list(4)

get_state_list(4)

__init__(3)

value_iteration(3)

reset(3)

get_parked(3)

get_Q_policy(3)

allStates(2)

num_actions(2)

numStates(2)

numActions(2)

initMDP(2)

get_available(2)

get_handicapped(2)

startState(2)

endStates(2)

gamma(2)

randomWalkSamples(1)

add_action(1)

valueIteration(1)

update_reward_only(1)

randomAction(1)

update_info(1)

representValues(1)

solve(1)

transform(1)

set_policy(1)

show(1)

train(1)

printAns(1)

take_action(1)

printResult(1)

buildMDP(1)

policyIteration(1)

apply_action_on_grid(1)

calc_rewards(1)

computePolicy(1)

environment(1)

getOptimalPolicy(1)

getOptimalValues(1)

build(1)

get_actions(1)

policyEvaluation(1)

get_reward(1)

예제 #1

파일 보기

    def __init__(self, grid, goalVals, discount=.99, tau=.01, epsilon=.001):

        MDP.__init__(self, discount=discount, tau=tau, epsilon=epsilon)

        self.goalVals = goalVals
        self.grid = grid

        self.setGridWorld()
        self.valueIteration()
        self.extractPolicy()

예제 #2

파일 보기

파일: GridWorld.py 프로젝트: joeyginorio/Markov-Decision-Process

	def __init__(self, grid, goalVals, discount=.99, tau=.01, epsilon=.001):

		MDP.__init__(self, discount=discount, tau=tau, epsilon=epsilon)

		self.goalVals = goalVals
		self.grid = grid

		self.setGridWorld()
		self.valueIteration()
		self.extractPolicy()

예제 #3

파일 보기

 def __init__(self, grid, terminals, init=(0, 0), gamma=.9):
     MDP.__init__(self, init, actlist=orientations, terminals=terminals, gamma=gamma)
     grid.reverse() ## because we want row 0 on bottom, not on top
     self.grid=grid
     self.rows=len(grid)
     self.cols=len(grid[0])
     for x in range(self.cols):
         for y in range(self.rows):
             self.reward[x, y] = grid[y][x]  # each reward is from the grid
             if grid[y][x] is not None:
                 self.states.add((x, y))     # each state is a tuple of indices

예제 #4

파일 보기

    def __init__(self, grid, terminals, init=(0, 0), gamma=.9):
        MDP.__init__(self,
                     init,
                     actlist=orientations,
                     terminals=terminals,
                     gamma=gamma)

        self.grid = grid
        self.rows = len(grid)
        self.cols = len(grid[0])

        # print(self.rows,self.cols)

        for x in range(self.cols):
            for y in range(self.rows):
                self.reward[y, x] = grid[y][x]
                if self.state_check((y, x)):
                    self.states.add((y, x))

Python MDP.__init__ 예제들

Python MDP.init 예제들