Python BernoulliArm示例

编程语言: Python

命名空间/包名称: banditpylib.arms

类/类型: BernoulliArm

hotexamples.com的示例: 7

Python BernoulliArm - 已找到7个示例。这些是从开源项目中提取的最受好评的banditpylib.arms.BernoulliArm现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

BernoulliArm(7)

常用方法

BernoulliArm (7)

示例#1

显示文件

 def test_simple_run(self):
     means = [0.3, 0.5, 0.7]
     arms = [BernoulliArm(mean) for mean in means]
     thres_bandit = ThresholdingBandit(arms=arms, theta=0.5, eps=0)
     thres_bandit.reset()
     assert thres_bandit.regret(MaxCorrectAnswers(answers=[0, 1, 1])) == 0
     assert thres_bandit.regret(AllCorrect(answers=[0, 1, 0])) == 1

示例#2

显示文件

文件： eps_greedy_test.py 项目： sheelfshah/banditpylib

    def test_simple_run(self):
        means = [0, 0.5, 0.7, 1]
        arms = [BernoulliArm(mean) for mean in means]
        learner = EpsGreedy(arm_num=len(arms))
        learner.reset()

        # Pull each arm once during the initial steps
        for time in range(1, len(arms) + 1):
            assert learner.actions(
                Context()).SerializeToString() == text_format.Parse(
                    """
        arm_pulls <
          arm <
            id: {arm_id}
          >
          times: 1
        >
        """.format(arm_id=time - 1), Actions()).SerializeToString()
            learner.update(
                text_format.Parse(
                    """
        arm_feedbacks <
          arm <
            id: {arm_id}
          >
          rewards: 0
        >
        """.format(arm_id=time - 1), Feedback()))

示例#3

显示文件

文件： ordinary_bandit_test.py 项目： choltz95/banditpylib

 def test_simple_run(self):
     means = [0, 1]
     arms = [BernoulliArm(mean) for mean in means]
     ordinary_bandit = OrdinaryBandit(arms)
     ordinary_bandit.reset()
     # pull arm 0 for 100 times
     ordinary_bandit.feed([(0, 100)])
     assert ordinary_bandit.regret(MaxReward()) == 100
     assert ordinary_bandit.regret(BestArmId(best_arm=1)) == 0

示例#4

显示文件

  def test_simple_run(self):
    means = [0, 0.5, 0.7, 1]
    arms = [BernoulliArm(mean) for mean in means]
    learner = EpsGreedy(arm_num=len(arms), horizon=10)
    learner.reset()

    for arm_id in range(len(arms)):
      assert learner.actions() == [(arm_id, 1)]
      learner.update(([np.array([0])], ))

示例#5

显示文件

 def test_simple_run(self):
     means = [0.3, 0.5, 0.7]
     arms = [BernoulliArm(mean) for mean in means]
     ordinary_bandit = OrdinaryBandit(arms)
     eps_greedy_learner = EpsGreedy(arm_num=3, horizon=10)
     single_player = SinglePlayerProtocol(bandit=ordinary_bandit,
                                          learners=[eps_greedy_learner])
     temp_file = tempfile.NamedTemporaryFile()
     single_player.play(trials=3, output_filename=temp_file.name)
     with open(temp_file.name, 'r') as f:
         # check number of records is 3
         lines = f.readlines()
         assert len(lines) == 3

示例#6

显示文件

    def test_simple_run(self):
        means = [0.3, 0.5, 0.7]
        arms = [BernoulliArm(mean) for mean in means]
        ordinary_bandit = MultiArmedBandit(arms)
        eps_greedy_learner = EpsGreedy(arm_num=3)
        single_player = SinglePlayerProtocol(bandit=ordinary_bandit,
                                             learners=[eps_greedy_learner])
        temp_file = tempfile.NamedTemporaryFile()
        single_player.play(3, temp_file.name, horizon=10)

        with open(temp_file.name, 'rb') as f:
            # check number of records is 3
            trials = parse_trials_from_bytes(f.read())
            assert len(trials) == 3

示例#7

显示文件

 def test_simple_run(self):
     means = [0, 1]
     arms = [BernoulliArm(mean) for mean in means]
     ordinary_bandit = MultiArmedBandit(arms)
     ordinary_bandit.reset()
     # Pull arm 0 for 100 times
     actions = text_format.Parse(
         """
   arm_pulls {
     arm {
       id: 0
     }
     times: 100
   }
   """, Actions())
     ordinary_bandit.feed(actions)
     assert ordinary_bandit.regret(MaximizeTotalRewards()) == 100
     arm = Arm()
     arm.id = 1
     assert ordinary_bandit.regret(IdentifyBestArm(best_arm=arm)) == 0