Python TabularRewardFunction Examples

Programming Language: Python

Namespace/Package Name: irl_benchmark.irl.reward.reward_function

Examples at hotexamples.com: 7

Python TabularRewardFunction - 7 examples found. These are the top rated real world Python examples of irl_benchmark.irl.reward.reward_function.TabularRewardFunction extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

TabularRewardFunction(7)

reward(1)

Example #1

Show file

def test_tab_featb_functions():
    env = feature_make('FrozenLake8x8-v0')
    params = np.zeros(64)
    params[-1] = 1.
    rf = FeatureBasedRewardFunction(env, params)
    domain = rf.domain()
    rf2 = TabularRewardFunction(env, params)
    rf_true = make_true_reward('FrozenLake8x8-v0')
    rew1 = rf.reward(domain)
    rew2 = rf2.reward(domain)
    rew_true = rf_true.reward(domain)
    assert np.all(rew_true == rew1)
    assert np.all(rew1 == rew2)
    assert rew_true.shape == rew1.shape
    assert rew1.shape == rew2.shape

Example #2

Show file

 def reward_function_factory(env):
     params = np.zeros(64)
     params[-1] = 1.
     return TabularRewardFunction(env, params)

Example #3

Show file

File: rl_model_wrapper_test.py Project: liamondrop/irl-benchmark

 def reward_function_factory(env):
     return TabularRewardFunction(env, true_rews[:-1])

Example #4

Show file

File: truth.py Project: dit7ya/irl-benchmark-1

def frozen_lake_8_8(env):
    parameters = np.zeros(64)
    parameters[-1] = 1.0
    print("Making", env, parameters)
    return TabularRewardFunction(env, parameters)

Example #5

Show file

def frozen_lake(env):
    parameters = np.zeros(16)
    parameters[-1] = 1.0
    return TabularRewardFunction(env, parameters)

Example #6

Show file

File: irl_reward_wrapper_test.py Project: liamondrop/irl-benchmark

 def rew_fun_factory(env):
     return TabularRewardFunction(env, 'random')

Example #7

Show file

def test_random_tabular_function():
    env = make_env('FrozenLake-v0')
    rf = TabularRewardFunction(env, 'random')