Python unpack_reward примеры использования

Язык программирования: Python

Пространство имен/Пакет: tests.aux

Метод/Функция: unpack_reward

Примеров на hotexamples.com: 13

Python unpack_reward - 13 примеров найдено. Это лучшие примеры Python кода для tests.aux.unpack_reward, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

def test_negative_reward(make_ready_env, datums):
    datums.add().rows([1], [1], [0.5], [1], [0.5])
    env = make_ready_env(cash=10)
    assert unpack_reward(env.step([0, 1])) == 1.0
    assert unpack_reward(env.step([1, 0])) == 0.5
    assert unpack_reward(env.step([0, 1])) == 0.5
    assert unpack_reward(env.step([1, 0])) == 0.25

Пример #2

Показать файл

def test_commission_fees_are_deducted_on_all_shifted_assets(
        make_ready_env, datums):
    datums.add().rows([1], [1], [3])
    datums.add().rows([1], [1], [0.5])
    env = make_ready_env(cash=10, commission=0.1)
    assert unpack_reward(env.step([0, 0.6, 0.4])) == 0.9
    assert unpack_reward(env.step([1, 0, 0])) == approx((2 * 0.9) * 0.9)

Пример #3

Показать файл

def test_immediate_relative_reward(make_ready_env, datums):
    datums.add().rows([1], [1], [0.5], [0.5], [1])
    env = RelativeReward(make_ready_env(cash=10))
    assert unpack_reward(env.step([0, 1])) == 1
    assert unpack_reward(env.step([0, 1])) == 0.5
    assert unpack_reward(env.step([0, 1])) == 1
    assert unpack_reward(env.step([0, 1])) == 2

Пример #4

Показать файл

def test_positive_reward(make_ready_env, datums):
    datums.add().rows([1], [1], [2], [1], [2])
    env = make_ready_env(cash=10)
    assert unpack_reward(env.step([0, 1])) == 1.0
    assert unpack_reward(env.step([1, 0])) == 2.0
    assert unpack_reward(env.step([0, 1])) == 2.0
    assert unpack_reward(env.step([1, 0])) == 4.0

Пример #5

Показать файл

Файл: test_random_walk.py Проект: SwamyDev/gym-quickcheck

def test_each_step_outside_of_goal_returns_a_penalty(env, walk_len,
                                                     steps_to_edge):
    assert all(
        unpack_reward(env.step(0)) == env.penalty
        for _ in range(steps_to_edge))
    assert all(
        unpack_reward(env.step(1)) == env.penalty for _ in range(walk_len - 2))

Пример #6

Показать файл

def test_final_value_of_portfolio_as_only_reward(make_ready_env, datums):
    datums.add().rows([1], [1], [2], [1], [2])
    env = OnlyFinalReward(make_ready_env(cash=10))
    assert unpack_reward(env.step([0, 1])) == 0.0
    assert unpack_reward(env.step([1, 0])) == 0.0
    assert unpack_reward(env.step([0, 1])) == 0.0
    assert unpack_reward(env.step([1, 0])) == 4.0

Пример #7

Показать файл

def test_commission_fees_are_deducted(make_ready_env, datums):
    datums.add().rows([1], [1], [2], [1], [2])
    env = make_ready_env(cash=10, commission=0.1)
    assert unpack_reward(env.step([0, 1])) == 0.9
    assert unpack_reward(env.step([1, 0])) == approx((2 * 0.9) * 0.9)
    assert unpack_reward(env.step([0, 1])) == approx((2 * 0.9) * 0.9**2)
    assert unpack_reward(env.step([1, 0])) == approx(
        (2 * (2 * 0.9) * 0.9**2) * 0.9)

Пример #8

Показать файл

def test_relative_reward_resets_properly(make_ready_env, datums):
    datums.add().rows([1], [1], [0.5])
    env = RelativeReward(make_ready_env(cash=10))
    assert unpack_reward(env.step([0, 1])) == 1
    assert unpack_reward(env.step([0, 1])) == 0.5
    env.reset()
    assert unpack_reward(env.step([0, 1])) == 1
    assert unpack_reward(env.step([0, 1])) == 0.5

Пример #9

Показать файл

def test_combine_reward_wrappers(make_ready_env, datums, baseline_datums):
    datums.add().rows([1], [1], [2], [1], [2])
    baseline_datums.rows(1.0, 1.2, 1.4, 1.6, 2)
    env = OnlyFinalReward(
        SharpRatioReward(make_ready_env(cash=10, baseline=baseline_datums)))
    assert unpack_reward(env.step([0, 1])) == 0
    assert unpack_reward(env.step([1, 0])) == 0
    assert unpack_reward(env.step([0, 1])) == 0
    assert unpack_reward(env.step([1, 0])) == approx(
        np.mean([-0.2, 0.6, 0.4, 2]) / np.std([-0.2, 0.6, 0.4, 2], ddof=1))

Пример #10

Показать файл

def test_calculate_growing_sharp_ratio(make_ready_env, datums,
                                       baseline_datums):
    datums.add().rows([1], [1], [2], [1], [2])
    baseline_datums.rows(1.0, 1.2, 1.4, 1.6, 2)
    env = SharpRatioReward(make_ready_env(cash=10, baseline=baseline_datums))
    assert unpack_reward(env.step([0, 1])) == approx(-0.2)
    assert unpack_reward(env.step([1, 0])) == approx(
        np.mean([-0.2, 0.6]) / np.std([-0.2, 0.6], ddof=1))
    assert unpack_reward(env.step([0, 1])) == approx(
        np.mean([-0.2, 0.6, 0.4]) / np.std([-0.2, 0.6, 0.4], ddof=1))
    assert unpack_reward(env.step([1, 0])) == approx(
        np.mean([-0.2, 0.6, 0.4, 2]) / np.std([-0.2, 0.6, 0.4, 2], ddof=1))

Пример #11

Показать файл

def test_commission_fees_are_not_deducted_when_assets_are_not_moved(
        make_ready_env, datums):
    datums.add().rows([1], [1], [2])
    env = make_ready_env(cash=10, commission=0.1)
    assert unpack_reward(idle_step(env)) == 1.0
    assert unpack_reward(idle_step(env)) == 1.0

Пример #12

Показать файл

def test_idle_reward(make_ready_env, datums):
    datums.add().rows([1], [1], [2])
    env = make_ready_env(cash=10)
    assert unpack_reward(idle_step(env)) == 1.0

Пример #13

Показать файл

Файл: test_n_knob.py Проект: SwamyDev/gym-quickcheck

def test_each_step_gives_a_reward_of_minus_one(env, idle):
    env.reset()
    assert unpack_reward(env.step(idle)) == -1