Python EpsilonGreedy 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: boe.bandit.algorithms

클래스/타입: EpsilonGreedy

hotexamples.com에서의 예제들: 7

Python EpsilonGreedy - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 boe.bandit.algorithms.EpsilonGreedy에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

EpsilonGreedy(6)

pull(3)

create(1)

update(1)

자주 사용되는 메소드들

EpsilonGreedy (6)

예제 #1

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

    def test_pull_returns_a_valid_arm(self, k, e, rounds):
        egreedy = EpsilonGreedy(num_arms=k, epsilon=e)
        for _ in range(rounds):
            arm = egreedy.pull()

            self.assertGreaterEqual(arm, 0)
            self.assertLess(arm, k)

예제 #2

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

    def test_pull_does_not_change_state(self, k, e, rounds):
        egreedy = EpsilonGreedy(num_arms=k, epsilon=e)

        for _ in range(rounds):
            egreedy.pull()

        self.assertEqual(0, sum(egreedy.pull_counts))
        self.assertEqual(0, sum(egreedy.rewards))

예제 #3

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

    def test_the_best_arm_based_on_feedback(self, k, e, rounds):
        p = np.random.random(k)
        p = p / np.sum(p)
        egreedy = EpsilonGreedy.create(e, rewards=p)
        pulls = np.zeros(k, dtype=np.uint64)

        for _ in range(rounds):
            arm = egreedy.pull()
            pulls[arm] += 1

        self.assertEqual(np.argmax(p), np.argmax(pulls))

예제 #4

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

    def test_pull_does_not_change_state_after_any_updates(
            self, k, e, rounds, updates):
        egreedy = EpsilonGreedy(num_arms=k, epsilon=e)

        for _ in range(updates):
            egreedy.update(chosen_arm=np.random.randint(0, k),
                           reward=np.random.random())

        pulls = sum(egreedy.pull_counts)
        rewards = sum(egreedy.rewards)

        for _ in range(rounds):
            egreedy.pull()

        self.assertEqual(pulls, sum(egreedy.pull_counts))
        self.assertEqual(rewards, sum(egreedy.rewards))

예제 #5

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

 def test_init_fails_with_epsilon_above_one(self, k, e):
     assume(e > 1.0)
     with self.assertRaises(AssertionError,
                            msg="epsilon should be between [0, 1]"):
         _ = EpsilonGreedy(num_arms=k, epsilon=e)

예제 #6

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

 def test_init_fails_with_invalid_nums_arms(self, k, e):
     with self.assertRaises(AssertionError,
                            msg="there should be more than one arm"):
         _ = EpsilonGreedy(num_arms=k, epsilon=e)

예제 #7

0

파일 보기

파일: algorithms_tests.py 프로젝트: guidj/BOE

    def test_init_set_config_correctly(self, k, e):
        egreedy = EpsilonGreedy(num_arms=k, epsilon=e)

        self.assertEqual(k, egreedy.num_arms)
        self.assertEqual(e, egreedy.epsilon)