Python Learner.build_networkの例

プログラミング言語: Python

名前空間/パッケージ名: learner

クラス/型: Learner

メソッド/関数: build_network

hotexamples.comのコード掲載数: 2

Python Learner.build_network - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlearner.Learner.build_networkの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Learner(30)

__init__(7)

_convert(3)

getNextMove(3)

actor_noise(2)

build_network(2)

LabelledDocs(1)

calc_pairwise_dists(1)

main(1)

getNumData(1)

getAction(1)

display_tree(1)

cross_validation(1)

classify(1)

checkQuorumSatisfied(1)

calculate_viterbi(1)

batch_out(1)

build_update_ops(1)

batch_in(1)

agent(1)

add_string(1)

addVote(1)

addState(1)

addReply(1)

_test(1)

_get_misclassification(1)

TensorNaN(1)

trainModel(1)

コード例 #1

ファイルを表示

def train():

    # Set random seeds for reproducability
    np.random.seed(train_params.RANDOM_SEED)
    random.seed(train_params.RANDOM_SEED)
    tf.random.set_seed(train_params.RANDOM_SEED)

    # Initialise prioritised experience replay memory
    PER_memory = PrioritizedReplayBuffer(train_params.REPLAY_MEM_SIZE,
                                         train_params.PRIORITY_ALPHA)
    # Initialise Gaussian noise generator
    gaussian_noise = GaussianNoiseGenerator(train_params.ACTION_DIMS,
                                            train_params.ACTION_BOUND_LOW,
                                            train_params.ACTION_BOUND_HIGH,
                                            train_params.NOISE_SCALE)

    # Create threads for learner process and agent processes
    threads = []
    # Create threading events for communication and synchronisation between the learner and agent threads
    run_agent_event = threading.Event()
    stop_agent_event = threading.Event()

    # with tf.device('/device:GPU:0'):
    # Initialise learner
    learner = Learner(PER_memory, run_agent_event, stop_agent_event)
    # Build learner networks
    learner.build_network()
    # Initialise variables (either from ckpt file if given, or from random)
    learner.initialise_vars()
    # Get learner policy (actor) network params - agent needs these to copy latest policy params periodically
    learner_policy_params = learner.actor_net.trainable_variables  # TODO : consider batch later

    threads.append(threading.Thread(target=learner.run))

    for n_agent in range(train_params.NUM_AGENTS):
        # Initialise agent
        agent = Agent(train_params.ENV, train_params.RANDOM_SEED,
                      learner_policy_params, n_agent)
        # Build network
        agent.build_network(training=True)
        agent.build_summaries(train_params.LOG_DIR +
                              ('/train/agent_%02d' % n_agent))

        threads.append(
            threading.Thread(target=agent.run,
                             args=(PER_memory, gaussian_noise, run_agent_event,
                                   stop_agent_event)))

    for t in threads:
        t.start()

    for t in threads:
        t.join()

コード例 #2

ファイルを表示

def train():

    tf.reset_default_graph()

    # Set random seeds for reproducability
    np.random.seed(train_params.RANDOM_SEED)
    random.seed(train_params.RANDOM_SEED)
    tf.set_random_seed(train_params.RANDOM_SEED)

    # Initialise prioritised experience replay memory
    PER_memory = PrioritizedReplayBuffer(train_params.REPLAY_MEM_SIZE,
                                         train_params.PRIORITY_ALPHA)
    # Initialise Gaussian noise generator
    gaussian_noise = GaussianNoiseGenerator(train_params.ACTION_DIMS,
                                            train_params.ACTION_BOUND_LOW,
                                            train_params.ACTION_BOUND_HIGH,
                                            train_params.NOISE_SCALE)

    # Create session
    config = tf.ConfigProto(allow_soft_placement=True)
    config.gpu_options.allow_growth = True
    sess = tf.Session(config=config)

    # Create threads for learner process and agent processes
    threads = []
    # Create threading events for communication and synchronisation between the learner and agent threads
    run_agent_event = threading.Event()
    stop_agent_event = threading.Event()

    # with tf.device('/device:GPU:0'):
    # Initialise learner
    learner = Learner(sess, PER_memory, run_agent_event, stop_agent_event)
    # Build learner networks
    learner.build_network()
    # Build ops to update target networks
    learner.build_update_ops()
    # Initialise variables (either from ckpt file if given, or from random)
    learner.initialise_vars()
    # Get learner policy (actor) network params - agent needs these to copy latest policy params periodically
    learner_policy_params = learner.actor_net.network_params + learner.actor_net.bn_params

    threads.append(threading.Thread(target=learner.run))

    for n_agent in range(train_params.NUM_AGENTS):
        # Initialise agent
        agent = Agent(sess, train_params.ENV, train_params.RANDOM_SEED,
                      n_agent)
        # Build network
        agent.build_network(training=True)
        # Build op to periodically update agent network params from learner network
        agent.build_update_op(learner_policy_params)
        # Create Tensorboard summaries to save episode rewards
        if train_params.LOG_DIR is not None:
            agent.build_summaries(train_params.LOG_DIR +
                                  ('/agent_%02d' % n_agent))

        threads.append(
            threading.Thread(target=agent.run,
                             args=(PER_memory, gaussian_noise, run_agent_event,
                                   stop_agent_event)))

    for t in threads:
        t.start()

    for t in threads:
        t.join()

    sess.close()