Python TabularRewardFunctionの例

プログラミング言語: Python

名前空間/パッケージ名: irl_benchmark.irl.reward.reward_function

hotexamples.comのコード掲載数: 7

Python TabularRewardFunction - 7件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのirl_benchmark.irl.reward.reward_function.TabularRewardFunctionの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

TabularRewardFunction(7)

reward(1)

よく使われるメソッド

TabularRewardFunction (7)

reward (1)

コード例 #1

ファイルを表示

def test_tab_featb_functions():
    env = feature_make('FrozenLake8x8-v0')
    params = np.zeros(64)
    params[-1] = 1.
    rf = FeatureBasedRewardFunction(env, params)
    domain = rf.domain()
    rf2 = TabularRewardFunction(env, params)
    rf_true = make_true_reward('FrozenLake8x8-v0')
    rew1 = rf.reward(domain)
    rew2 = rf2.reward(domain)
    rew_true = rf_true.reward(domain)
    assert np.all(rew_true == rew1)
    assert np.all(rew1 == rew2)
    assert rew_true.shape == rew1.shape
    assert rew1.shape == rew2.shape

コード例 #2

ファイルを表示

 def reward_function_factory(env):
     params = np.zeros(64)
     params[-1] = 1.
     return TabularRewardFunction(env, params)

コード例 #3

ファイルを表示

ファイル: rl_model_wrapper_test.py プロジェクト: liamondrop/irl-benchmark

 def reward_function_factory(env):
     return TabularRewardFunction(env, true_rews[:-1])

コード例 #4

ファイルを表示

ファイル: truth.py プロジェクト: dit7ya/irl-benchmark-1

def frozen_lake_8_8(env):
    parameters = np.zeros(64)
    parameters[-1] = 1.0
    print("Making", env, parameters)
    return TabularRewardFunction(env, parameters)

コード例 #5

ファイルを表示

def frozen_lake(env):
    parameters = np.zeros(16)
    parameters[-1] = 1.0
    return TabularRewardFunction(env, parameters)

コード例 #6

ファイルを表示

ファイル: irl_reward_wrapper_test.py プロジェクト: liamondrop/irl-benchmark

 def rew_fun_factory(env):
     return TabularRewardFunction(env, 'random')

コード例 #7

ファイルを表示

def test_random_tabular_function():
    env = make_env('FrozenLake-v0')
    rf = TabularRewardFunction(env, 'random')