Python Actor.create_policy_netの例

プログラミング言語: Python

名前空間/パッケージ名: actor

クラス/型: Actor

メソッド/関数: create_policy_net

hotexamples.comのコード掲載数: 1

Python Actor.create_policy_net - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのactor.Actor.create_policy_netの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Actor(30)

__init__(30)

eval(11)

choose_action(4)

get_will_save(4)

get_reflex_save(4)

get_fortitude_save(4)

get_action(4)

forward(4)

draw(4)

take_damage(4)

add_movie(4)

act(3)

from_SQLiteRow(3)

action(3)

build(2)

get_actions(2)

get_base_attack_bonus(2)

get_full_attack(2)

create_actor_model(2)

copy_weights(2)

from_string(2)

characterid(2)

mat_name(1)

get_details(1)

setstate(1)

route(1)

push_task(1)

get_alignment_var(1)

get_attack_bonus(1)

get_attack_damage(1)

position(1)

get_base_attribute_score(1)

get_date_debut(1)

get_filter(1)

move_to(1)

get_first_name(1)

act_one_episode(1)

get_full_name(1)

get_rect(1)

mover(1)

_from_string(1)

move_towards(1)

has_private_parking(1)

isAlive(1)

get_action_for_train(1)

attack(1)

getArtistByid(1)

decayEligibilities(1)

build_train_op(1)

コード例 #1

ファイルを表示

ファイル: main.py プロジェクト: N1kYan/ReinforcementLearning

    a_state_input = graph.get_tensor_by_name("actor/state_input:0")
    a_actions_input = graph.get_tensor_by_name("actor/actions_input:0")
    a_advantages_input = \
        graph.get_tensor_by_name("actor/advantages_input:0")
    a_probabilities = graph.get_tensor_by_name("actor/probabilities:0")
    a_weights = graph.get_tensor_by_name("actor/weights:0")

    c_state_input = graph.get_tensor_by_name("critic/state_input:0")
    c_true_vf_input = graph.get_tensor_by_name("critic/true_vf_input:0")
    c_output = graph.get_tensor_by_name("critic/output:0")
    c_optimizer = tf.get_collection("optimizer")
    c_loss = graph.get_tensor_by_name("critic/loss:0")

else:
    a_state_input, a_actions_input, a_advantages_input, \
        a_probabilities, a_weights = Actor.create_policy_net(env)

    c_state_input, c_true_vf_input, c_output, c_optimizer, c_loss = \
        Critic.create_value_net(env)

actor = Actor(env, a_state_input, a_actions_input, a_advantages_input,
              a_probabilities, a_weights)
critic = Critic(env, c_state_input, c_true_vf_input, c_output, c_optimizer,
                c_loss)
nac = NAC(env, actor, critic)

if LOAD_WEIGHTS is None:
    sess.run(tf.global_variables_initializer())

env.network_generation_time = int(time.time() - start_time)
print("Done! (Time: " + str(env.network_generation_time) + " seconds)")