Python Agent.load Beispiele

Programmiersprache: Python

Namespace / Paketname: dqn.agent

Klasse / Typ: Agent

Methode / Funktion: load

Beispiele auf hotexamples.com: 2

Python Agent.load - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die dqn.agent.Agent.load, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Agent(30)

play(23)

train(9)

predict(3)

get_action(3)

save_model(2)

act(2)

total_loss(2)

total_q(2)

observe(2)

update(2)

load(2)

inject_summary(2)

update_count(2)

save(2)

train_poison(1)

transfer_weights(1)

train_ep(1)

update_q_network(1)

test_video(1)

update_target_model(1)

step(1)

save_weight_to_pkl(1)

q_target(1)

reset(1)

randomplay(1)

q_eval(1)

play_poison(1)

play_mine(1)

play_image(1)

play2(1)

network_synchronize(1)

memorize(1)

load_weight_from_pkl(1)

init_for_stage(1)

exp_play(1)

e_greedy_action(1)

updated_target_q_network(1)

Beispiel #1

Datei anzeigen

def main(_):
    gpu_options = tf.GPUOptions(
        per_process_gpu_memory_fraction=calc_gpu_fraction(FLAGS.gpu_fraction))

    with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) as sess:
        config = get_config(FLAGS) or FLAGS

        if config.env_type == 'simple':
            env = SimpleGymEnvironment(config)
        else:
            env = GymEnvironment(config)

        ACPconfig = ACPConfig(env)

        if not tf.test.is_gpu_available() and FLAGS.use_gpu:
            raise Exception("use_gpu flag is true when no GPUs are available")

        if not FLAGS.use_gpu:
            config.cnn_format = 'NHWC'

        # Becuase of code shittines, these steps should be after each other!
        acpAgent = acp.acp(sess, ACPconfig)
        agentDQN = Agent(config, env, acpAgent, sess)
        acpAgent.setdir(agentDQN.model_dir)

        sess.run(tf.initializers.global_variables())
        # Load both models if exist any checkpoint
        acpAgent.load()
        agentDQN.load()
        if FLAGS.is_train:
            agentDQN.train()
        else:
            raise Exception('agentDQN.play() is Not Implemented')
            agentDQN.play()

Beispiel #2

Datei anzeigen

    deque(maxlen=200) for _ in range(4)
]
agent_obs = [None] * flags.num_agents
agent_obs_buffer = [None] * flags.num_agents
agent_action_buffer = [2] * flags.num_agents
max_steps = 8 * (flags.grid_width + flags.grid_height)
start_time = time.time()

# Load an RL agent and initialize it from checkpoint if necessary
if flags.agent_type == "dqn":
    agent = DQN_Agent(state_size, action_size, flags.num_agents)
elif flags.agent_type == "ppo":
    agent = PPO_Agent(state_size, action_size, flags.num_agents)

if flags.load_model:
    start, eps = agent.load(project_root / 'checkpoints', 0, 1.0)
else:
    start, eps = 0, 1.0

if not flags.train:
    eps = 0.0

# We don't want to retrain on old railway networks when we restart from a checkpoint, so we just loop
# through the generators to get all the old networks out of the way
if start > 0: print(f"Skipping {start} railways")
for _ in range(0, start):
    rail_generator()
    schedule_generator()

# Helper function to detect collisions
ACTIONS = {0: 'B', 1: 'L', 2: 'F', 3: 'R', 4: 'S'}