Python Gridworld.default_grid 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gridworld

클래스/타입: Gridworld

메소드/함수: default_grid

hotexamples.com에서의 예제들: 4

Python Gridworld.default_grid - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gridworld.Gridworld.default_grid에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Gridworld(20)

default_grid(4)

apply_action(2)

is_goal(2)

__init__(1)

add_agent(1)

add_goal(1)

current(1)

draw_frame(1)

draw_state_labels(1)

get_all_states(1)

get_current_state(1)

get_random_state(1)

get_state(1)

make_video(1)

예제 #1

파일 보기

파일: monte_carlo.py 프로젝트: Gistbatch/Reinforcement

def simple_example():
    grid = Gridworld.default_grid()
    print('Rewards:')
    print_values(grid.rewards, grid)
    policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'R',
        (2, 1): 'R',
        (2, 2): 'R',
        (2, 3): 'U',
    }
    values = first_visit_monte_carlo(grid, 100, policy)
    print('Values:')
    print_values(values, grid)
    print('Policy:')
    print_policy(policy, grid)

예제 #2

파일 보기

파일: td_zero.py 프로젝트: Gistbatch/Reinforcement

def simple_example():
    grid = Gridworld.default_grid()
    print('Rewards:')
    print_values(grid.rewards, grid)
    policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'R',
        (2, 1): 'R',
        (2, 2): 'R',
        (2, 3): 'U',
    }
    values = td_zero(grid, policy)
    print('Values:')
    print_values(values, grid)
    print('Policy:')
    print_policy(policy, grid)

예제 #3

파일 보기

def mc_prediction():
    grid = Gridworld.default_grid()
    print('Rewards:')
    print_values(grid.rewards, grid)
    policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'U',
        (2, 1): 'L',
        (2, 2): 'U',
        (2, 3): 'L',
    }
    values, deltas = approx_monte_carlo(grid, policy)
    plt.plot(deltas)
    plt.show()
    print('Values:')
    print_values(values, grid)
    print('Policy:')
    print_policy(policy, grid)

예제 #4

파일 보기

파일: policy_iteration.py 프로젝트: Gistbatch/Reinforcement

def simple_example():
    grid = Gridworld.default_grid()
    values_uniform = policy_evaluation(grid, 1)
    print('values for uniformly random actions:')
    print_values(values_uniform, grid)
    print('\n\n')

    fixed_policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'R',
        (2, 1): 'R',
        (2, 2): 'R',
        (2, 3): 'U',
    }
    print_policy(fixed_policy, grid)
    fixed_values = policy_evaluation(grid, 0.9, fixed_policy)
    print('Values for fixed policy:')
    print_values(fixed_values, grid)