Esempi in Python per Params.set_epsilon

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: Params

Classe/tipologia: Params

Metodo/funzione: set_epsilon

Esempi su hotexamples.com: 2

Params.set_epsilon in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per Params.Params.set_epsilon, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Params(30)

Eps(6)

select_dataset(6)

isTrue(6)

locs(4)

create_optimizer(3)

C(2)

genRand(2)

set_epsilon(2)

get_bestValue(2)

set_time_day(2)

initialize(2)

genBi(2)

genPi(2)

SetUserInfoAnnotator(2)

SetUserInfo(2)

NDIM(2)

LOW(2)

GRID_SIZE(2)

parse_config(1)

save(1)

scratchFile(1)

seed(1)

out_dir(1)

numYLabels(1)

sens_summary(1)

series_summary(1)

numExamples(1)

reset_Values(1)

set_min_value(1)

set(1)

syntheticParams(1)

verify_tariff(1)

validate(1)

update_dict(1)

trainOrTest(1)

totalLength(1)

tofile(1)

take_ref(1)

supervised(1)

set_bestEpisode(1)

storagevet_requirement_check(1)

splParams(1)

show_params(1)

set_production_rate(1)

set_params(1)

monthly_data_summary(1)

set_bestValue(1)

set_bestLEARNING_RATE(1)

nb_alleles(1)

Esempio n. 1

Mostra file

File: main3x1.py Progetto: RoboticsLabURJC/2018-phd-pedro-fernandez

                    #QLearning_best['episode'] = episode
                    #QLearning_best['learning_rate'] = episode
                    #QLearning_best['best_value'] = episode

                elif agent == sarsaAgent:
                    SARSA_stats['episode'].append(episode)
                    SARSA_stats['learning_rate'].append(step_size)
                    SARSA_stats['best_value'].append(episode_reward)
                else:
                    expectedSARSA_stats['episode'].append(episode)
                    expectedSARSA_stats['learning_rate'].append(step_size)
                    expectedSARSA_stats['best_value'].append(episode_reward)

            # EPSILON DECAY for exploratory
            if params.END_EPSILON_DECAYING >= episode >= params.START_EPSILON_DECAYING:
                params.set_epsilon(params.epsilon_decay_value)

            # show some STATS
            ep_rewards.append(episode_reward)

            # Append the sum of reward at the end of the episode
            #totalReward[type(agent).__name__].append(episode_reward)
            all_reward_sums[(agent, step_size)].append(episode_reward)

            if not episode % params.STATS_EVERY:
                average_reward = sum(ep_rewards[-params.STATS_EVERY:]) / len(
                    ep_rewards[-params.STATS_EVERY:])
                aggr_ep_rewards['ep'].append(episode)
                aggr_ep_rewards['avg'].append(average_reward)
                aggr_ep_rewards['max'].append(
                    max(ep_rewards[-params.STATS_EVERY:]))

Esempio n. 2

Mostra file

File: main3x3.py Progetto: RoboticsLabURJC/2018-phd-pedro-fernandez

                                SARSA_stats['episode'].append(episode)
                                SARSA_stats['learning_rate'].append(step_size)
                                SARSA_stats['best_value'].append(episode_reward)
                                SARSA_stats['discount'].append(discount)
                                SARSA_stats['epsilondecay'].append(epsilondecay)
                            else:      
                                expectedSARSA_stats['episode'].append(episode)
                                expectedSARSA_stats['learning_rate'].append(step_size)
                                expectedSARSA_stats['best_value'].append(episode_reward)
                                expectedSARSA_stats['discount'].append(discount)
                                expectedSARSA_stats['epsilondecay'].append(epsilondecay)

                                
                    # EPSILON DECAY for exploratory 
                    if params.END_EPSILON_DECAYING >= episode >= params.START_EPSILON_DECAYING:
                        params.set_epsilon(epsilondecay)

                    # show some STATS 
                    ep_rewards.append(episode_reward)

                    # Append the sum of reward at the end of the episode
                    #totalReward[type(agent).__name__].append(episode_reward)
                    #all_reward_sums[(agent, step_size)].append(episode_reward)

                    if not episode % params.STATS_EVERY:
                        average_reward = sum(ep_rewards[-params.STATS_EVERY:])/len(ep_rewards[-params.STATS_EVERY:])
                        aggr_ep_rewards['ep'].append(episode)
                        aggr_ep_rewards['avg'].append(average_reward)
                        aggr_ep_rewards['max'].append(max(ep_rewards[-params.STATS_EVERY:]))
                        aggr_ep_rewards['min'].append(min(ep_rewards[-params.STATS_EVERY:]))
                        #print(f'Agent: {type(agent).__name__}, Learning Rate: {params.LEARNING_RATE}, discount: {params.DISCOUNT:>2.2f}, episode: {episode:>5d}, average reward: {average_reward:>4.1f},min reward: {min(ep_rewards[-params.STATS_EVERY:])}, max reward: {max(ep_rewards[-params.STATS_EVERY:])},current epsilon: {params.EPSILON:>1.3f},epsilon_decay_value: {params.epsilon_decay_value:>1.5f}')