Python GridworldContinuous.is_terminal примеры использования

Язык программирования: Python

Пространство имен/Пакет: imrl.environment.gridworld_continuous

Класс/Тип: GridworldContinuous

Метод/Функция: is_terminal

Примеров на hotexamples.com: 4

Python GridworldContinuous.is_terminal - 4 примера найдено. Это лучшие примеры Python кода для imrl.environment.gridworld_continuous.GridworldContinuous.is_terminal, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

GridworldContinuous(3)

is_terminal(2)

initial_state(1)

next_state(1)

Пример #1

Показать файл

Файл: test_gridworld_continuous.py Проект: xanderdunn/options

def test_taking_actions():
    """Does the environment correctly change the state when told to take an action with and without stochasticity?"""
    random.seed()
    env = GridworldContinuous(0.05, 0.01)
    start = env.initial_state()
    ratio = ratio_test(lambda state: np.linalg.norm(np.asarray([state[0] - start[0], state[1] - (start[1] + env.move_mean)]), 2) < env.move_sd * 2,
                       partial(env.next_state, start, Action.up), 10000)
    assert 0.7 < ratio
    steps = 0
    s = env.initial_state()
    while not env.is_terminal(s):
        s = env.next_state(s, np.random.randint(4))
        steps += 1
    assert steps < 20000

Пример #2

Показать файл

def test_taking_actions():
    """Does the environment correctly change the state when told to take an action with and without stochasticity?"""
    random.seed()
    env = GridworldContinuous(0.05, 0.01)
    start = env.initial_state()
    ratio = ratio_test(
        lambda state: np.linalg.norm(
            np.asarray(
                [state[0] - start[0], state[1] -
                 (start[1] + env.move_mean)]), 2) < env.move_sd * 2,
        partial(env.next_state, start, Action.up), 10000)
    assert 0.7 < ratio
    steps = 0
    s = env.initial_state()
    while not env.is_terminal(s):
        s = env.next_state(s, np.random.randint(4))
        steps += 1
    assert steps < 20000

Пример #3

Показать файл

def test_termination():
    """Does the environment terminate in the correct state?"""
    env = GridworldContinuous(0.05, 0.01)
    assert not env.is_terminal(GridPosition(0, 0))
    assert env.is_terminal(GridPosition(0.97, 0.98))

Пример #4

Показать файл

Файл: test_gridworld_continuous.py Проект: xanderdunn/options

def test_termination():
    """Does the environment terminate in the correct state?"""
    env = GridworldContinuous(0.05, 0.01)
    assert not env.is_terminal(GridPosition(0, 0))
    assert env.is_terminal(GridPosition(0.97, 0.98))