Python ClassifiersList.apply_reinforcement_learningの例

プログラミング言語: Python

名前空間/パッケージ名: lcs.agents.acs2

クラス/型: ClassifiersList

メソッド/関数: apply_reinforcement_learning

hotexamples.comのコード掲載数: 3

Python ClassifiersList.apply_reinforcement_learning - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlcs.agents.acs2.ClassifiersList.apply_reinforcement_learningの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

ClassifiersList(30)

append(20)

find_old_classifier(4)

apply_ga(3)

apply_reinforcement_learning(3)

form_action_set(3)

form_match_set(3)

add_alp_classifier(2)

add_ga_classifier(2)

apply_alp(2)

delete_a_classifier(2)

expand(2)

extend(2)

find_subsumer(2)

delete_ga_classifiers(1)

form_match_set_backwards(1)

コード例 #1

ファイルを表示

ファイル: test_ClassifierList.py プロジェクト: tigra/pyalcs-fixes

    def test_should_apply_reinforcement_learning(self, cfg):
        # given
        cl = Classifier(reward=34.29, immediate_reward=11.29, cfg=cfg)
        population = ClassifiersList(*[cl])

        # when
        ClassifiersList.apply_reinforcement_learning(population, 0, 28.79,
                                                     cfg.beta, cfg.gamma)

        # then
        assert abs(33.94 - cl.r) < 0.1
        assert abs(10.74 - cl.ir) < 0.1

コード例 #2

ファイルを表示

ファイル: test_ClassifierList.py プロジェクト: smiszym/pyalcs

    def test_should_apply_reinforcement_learning(self, cfg):
        # given
        population = ClassifiersList(cfg=cfg)
        c1 = Classifier(cfg=cfg)
        c1.r = 34.29
        c1.ir = 11.29
        population.append(c1)

        # when
        population.apply_reinforcement_learning(0, 28.79)

        # then
        assert abs(33.94 - population[0].r) < 0.1
        assert abs(10.74 - population[0].ir) < 0.1

コード例 #3

ファイルを表示

ファイル: acs2_self.py プロジェクト: smiszym/pyalcs

    # Play some games
    for g in range(GAMES):
        action_set = ClassifiersList(cfg=cfg)
        prev_state, action, reward, done = None, None, None, False
        state = board.reset()
        moves = 0

        while not done:
            player = determine_player(moves)  # Determine player

            match_set = ClassifiersList.form_match_set(population, state, cfg)

            if moves > 0:
                action_set.apply_alp(prev_state, action, state,
                                     ALL_MOVES + moves, population, match_set)
                action_set.apply_reinforcement_learning(
                    reward, match_set.get_maximum_fitness())
                if cfg.do_ga:
                    action_set.apply_ga(ALL_MOVES + moves, population,
                                        match_set, state)

            # Determine best action
            action = match_set.choose_action(cfg.epsilon)

            action_set = ClassifiersList.form_action_set(
                match_set, action, cfg)

            prev_state = state
            state, reward, done, debug = board.step(action)

            if done:
                action_set.apply_alp(prev_state, action, state,