Ejemplos de Params.get_bestValue en Python

Lenguaje de programación: Python

Namespace/Package Name: Params

Clase / Tipo: Params

Método / Función: get_bestValue

Ejemplos en hotexamples.com: 2

Python Params.get_bestValue - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de Params.Params.get_bestValue extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Params(30)

Eps(6)

select_dataset(6)

isTrue(6)

locs(4)

create_optimizer(3)

C(2)

genRand(2)

set_epsilon(2)

get_bestValue(2)

set_time_day(2)

initialize(2)

genBi(2)

genPi(2)

SetUserInfoAnnotator(2)

SetUserInfo(2)

NDIM(2)

LOW(2)

GRID_SIZE(2)

parse_config(1)

save(1)

scratchFile(1)

seed(1)

out_dir(1)

numYLabels(1)

sens_summary(1)

series_summary(1)

numExamples(1)

reset_Values(1)

set_min_value(1)

set(1)

syntheticParams(1)

verify_tariff(1)

validate(1)

update_dict(1)

trainOrTest(1)

totalLength(1)

tofile(1)

take_ref(1)

supervised(1)

set_bestEpisode(1)

storagevet_requirement_check(1)

splParams(1)

show_params(1)

set_production_rate(1)

set_params(1)

monthly_data_summary(1)

set_bestValue(1)

set_bestLEARNING_RATE(1)

nb_alleles(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: main3x1.py Proyecto: RoboticsLabURJC/2018-phd-pedro-fernandez

                                  (action, )] + params.LEARNING_RATE * (
                                      reward + params.DISCOUNT * expected_q)

                elif new_state[0] >= params.env.goal_position:
                    print(f"finish in episode {episode}")
                    print(
                        f'Episode: {episode:>5d}, average reward: {average_reward:>4.1f}, current epsilon: {params.EPSILON:>1.2f}, discount: {params.DISCOUNT:>2.2f},Learning Rate: {params.LEARNING_RATE}'
                    )
                    table[discrete_state + (action, )] = params.REWARD_END

                discrete_state = new_discrete_state

                episode_reward += reward

            # Get the BEST Value in all episodes
            if params.get_bestValue() < episode_reward:
                params.set_bestValue(episode_reward)
                params.set_bestEpisode(episode)
                params.set_bestLEARNING_RATE(step_size)
                #params.set_bestDISCOUNT(discount)
                best_stepsize[(agent, step_size)].append(episode_reward)
                if agent == qLearningAgent:
                    QLearning_stats['episode'].append(episode)
                    QLearning_stats['learning_rate'].append(step_size)
                    QLearning_stats['best_value'].append(episode_reward)
                    #QLearning_best['episode'] = episode
                    #QLearning_best['learning_rate'] = episode
                    #QLearning_best['best_value'] = episode

                elif agent == sarsaAgent:
                    SARSA_stats['episode'].append(episode)

Ejemplo n.º 2

Mostrar archivo

Archivo: main_V3.py Proyecto: RoboticsLabURJC/2018-phd-pedro-fernandez

                              (action, )] + params.LEARNING_RATE * (
                                  reward + params.DISCOUNT * expected_q)

            elif new_state[0] >= params.env.goal_position:
                print(f"finish in episode {episode}")
                print(
                    f'Episode: {episode:>5d}, average reward: {average_reward:>4.1f}, current epsilon: {params.EPSILON:>1.2f}, discount: {params.DISCOUNT:>2.2f},Learning Rate: {params.LEARNING_RATE}'
                )
                table[discrete_state + (action, )] = params.REWARD_END

            discrete_state = new_discrete_state

            episode_reward += reward

        # Get the BEST Value in all episodes
        if params.get_bestValue() < episode_reward:
            params.set_bestValue(episode_reward)
            params.set_bestEpisode(episode)

        # EPSILON DECAY for exploratory
        if params.END_EPSILON_DECAYING >= episode >= params.START_EPSILON_DECAYING:

            params.set_epsilon(params.epsilon_decay_value)

        # show some STATS
        ep_rewards.append(episode_reward)

        # Append the sum of reward at the end of the episode
        totalReward[type(agent).__name__].append(episode_reward)

        if not episode % params.STATS_EVERY: