Ejemplos de ClassifiersList.apply_reinforcement_learning en Python

Lenguaje de programación: Python

Namespace/Package Name: lcs.agents.acs2

Clase / Tipo: ClassifiersList

Método / Función: apply_reinforcement_learning

Ejemplos en hotexamples.com: 3

Python ClassifiersList.apply_reinforcement_learning - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de lcs.agents.acs2.ClassifiersList.apply_reinforcement_learning extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

ClassifiersList(30)

append(20)

find_old_classifier(4)

apply_ga(3)

apply_reinforcement_learning(3)

form_action_set(3)

form_match_set(3)

add_alp_classifier(2)

add_ga_classifier(2)

apply_alp(2)

delete_a_classifier(2)

expand(2)

extend(2)

find_subsumer(2)

delete_ga_classifiers(1)

form_match_set_backwards(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_ClassifierList.py Proyecto: tigra/pyalcs-fixes

    def test_should_apply_reinforcement_learning(self, cfg):
        # given
        cl = Classifier(reward=34.29, immediate_reward=11.29, cfg=cfg)
        population = ClassifiersList(*[cl])

        # when
        ClassifiersList.apply_reinforcement_learning(population, 0, 28.79,
                                                     cfg.beta, cfg.gamma)

        # then
        assert abs(33.94 - cl.r) < 0.1
        assert abs(10.74 - cl.ir) < 0.1

Ejemplo n.º 2

Mostrar archivo

Archivo: test_ClassifierList.py Proyecto: smiszym/pyalcs

    def test_should_apply_reinforcement_learning(self, cfg):
        # given
        population = ClassifiersList(cfg=cfg)
        c1 = Classifier(cfg=cfg)
        c1.r = 34.29
        c1.ir = 11.29
        population.append(c1)

        # when
        population.apply_reinforcement_learning(0, 28.79)

        # then
        assert abs(33.94 - population[0].r) < 0.1
        assert abs(10.74 - population[0].ir) < 0.1

Ejemplo n.º 3

Mostrar archivo

Archivo: acs2_self.py Proyecto: smiszym/pyalcs

    # Play some games
    for g in range(GAMES):
        action_set = ClassifiersList(cfg=cfg)
        prev_state, action, reward, done = None, None, None, False
        state = board.reset()
        moves = 0

        while not done:
            player = determine_player(moves)  # Determine player

            match_set = ClassifiersList.form_match_set(population, state, cfg)

            if moves > 0:
                action_set.apply_alp(prev_state, action, state,
                                     ALL_MOVES + moves, population, match_set)
                action_set.apply_reinforcement_learning(
                    reward, match_set.get_maximum_fitness())
                if cfg.do_ga:
                    action_set.apply_ga(ALL_MOVES + moves, population,
                                        match_set, state)

            # Determine best action
            action = match_set.choose_action(cfg.epsilon)

            action_set = ClassifiersList.form_action_set(
                match_set, action, cfg)

            prev_state = state
            state, reward, done, debug = board.step(action)

            if done:
                action_set.apply_alp(prev_state, action, state,