Ejemplos de EpsilonGreedy.select_action en Python

Lenguaje de programación: Python

Namespace/Package Name: obp.policy.contextfree

Clase / Tipo: EpsilonGreedy

Método / Función: select_action

Ejemplos en hotexamples.com: 2

Python EpsilonGreedy.select_action - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de obp.policy.contextfree.EpsilonGreedy.select_action extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

EpsilonGreedy(8)

action_counts(4)

reward_counts(4)

action_counts_temp(2)

reward_counts_temp(2)

select_action(2)

update_params(2)

Ejemplo n.º 1

Mostrar archivo

def test_egreedy_select_action_exploration():
    trial_num = 50
    policy = EpsilonGreedy(n_actions=2, epsilon=1.0)
    policy.action_counts = np.array([3, 3])
    policy.reward_counts = np.array([3, 0])
    selected_action = [policy.select_action() for _ in range(trial_num)]
    assert 0 < sum(selected_action)[0] < trial_num

Ejemplo n.º 2

Mostrar archivo

def test_egreedy_select_action_exploitation():
    trial_num = 50
    policy = EpsilonGreedy(n_actions=2, epsilon=0.0)
    policy.action_counts = np.array([3, 3])
    policy.reward_counts = np.array([3, 0])
    for _ in range(trial_num):
        assert policy.select_action()[0] == 0