Python Logger.log_performance Beispiele

Programmiersprache: Python

Namespace / Paketname: lib.Logger

Klasse / Typ: Logger

Methode / Funktion: log_performance

Beispiele auf hotexamples.com: 1

Python Logger.log_performance - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die lib.Logger.Logger.log_performance, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Logger(24)

log(9)

info(6)

write(3)

openInAppendMode(2)

record_log(2)

plot(2)

openInOverwriteMode(2)

get_logger(2)

error(2)

debug(2)

log_performance(1)

balance(1)

price(1)

printOk(1)

printStart(1)

progress(1)

summary(1)

write_log_file(1)

Beispiel #1

Datei anzeigen

Datei: run_dqn.py Projekt: saavivi/Mastering-Blackjack

def dqn_run_experiments():
    for i in range(NUM_EXP):
        # Make environment
        env = rlcard.make('blackjack', config={'seed': i})
        eval_env = rlcard.make('blackjack', config={'seed': i})

        # Set the iterations numbers and how frequently we evaluate/save plot

        # The initial memory size
        memory_init_size = 100

        # Train the agent every X steps
        train_every = 1

        # The paths for saving the logs and learning curves
        log_dir = f"{DQN_RES_DIR}/{i}"

        # Set up the agents
        agent = DQNAgent('dqn',
                         action_num=env.action_num,
                         replay_memory_init_size=memory_init_size,
                         train_every=train_every,
                         state_shape=env.state_shape,
                         mlp_layers=[128, 256, 512],
                         debug=True)
        env.set_agents([agent])
        eval_env.set_agents([agent])


        # Init a Logger to plot the learning curve
        logger = Logger(log_dir, debug=True)

        for episode in range(DQN_TRAINING_DURATION):

            # Generate data from the environment
            trajectories, _ = env.run(is_training=True)

            # Feed transitions into agent memory, and train the agent
            for ts in trajectories[0]:
                agent.feed(ts)

            # Evaluate the performance. Play with random agents.
            if episode % EVALUATE_EVERY == 0:
                logger.log_performance(env.timestep, tournament(eval_env, EVALUATE_NUM_OF_HANDS)[0])

            # Close files in the logger
            # logger.close_files()

        # Plot the learning curve
        logger.plot(f"DQN_{i}")
    BaseAgent.plot_avg(DQN_RES_DIR, "DQN")