Python TwoArmedBandit.observation示例

编程语言: Python

命名空间/包名称: fitr.environments

类/类型: TwoArmedBandit

方法/功能: observation

hotexamples.com的示例: 3

Python TwoArmedBandit.observation - 已找到3个示例。这些是从开源项目中提取的最受好评的fitr.environments.TwoArmedBandit.observation现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

TwoArmedBandit(11)

observation(3)

random_action(3)

step(2)

示例#1

显示文件

文件： test_value_functions.py 项目： abrahamnunes/fitr

def test_asymmetric_rwlearner():
    task = TwoArmedBandit()
    critic = AsymmetricRescorlaWagnerLearner(task,
                                             learning_rate_pos=0.1,
                                             learning_rate_neg=0.1)
    x = task.observation()
    u = task.random_action()
    x_, r, _ = task.step(u)
    critic.update(x, u, r, x_, None)

示例#2

显示文件

文件： test_value_functions.py 项目： abrahamnunes/fitr

def test_forgetful_rwlearner():
    task = TwoArmedBandit()
    critic = ForgetfulInstrumentalRescorlaWagnerLearner(task,
                                                        learning_rate=0.1,
                                                        memory_decay=0.1)
    x = task.observation()
    u = task.random_action()
    x_, r, _ = task.step(u)
    critic.update(x, u, r, x_, None)

示例#3

显示文件

文件： test_environments.py 项目： abrahamnunes/fitr

def test_two_armed_bandit():
    task = TwoArmedBandit()
    x = task.observation()
    u = task.random_action()