Python Actor.act_one_episodeの例

プログラミング言語: Python

名前空間/パッケージ名: actor

クラス/型: Actor

メソッド/関数: act_one_episode

hotexamples.comのコード掲載数: 1

Python Actor.act_one_episode - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのactor.Actor.act_one_episodeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Actor(30)

__init__(30)

eval(11)

choose_action(4)

get_will_save(4)

get_reflex_save(4)

get_fortitude_save(4)

get_action(4)

forward(4)

draw(4)

take_damage(4)

add_movie(4)

act(3)

from_SQLiteRow(3)

action(3)

build(2)

get_actions(2)

get_base_attack_bonus(2)

get_full_attack(2)

create_actor_model(2)

copy_weights(2)

from_string(2)

characterid(2)

mat_name(1)

get_details(1)

setstate(1)

route(1)

push_task(1)

get_alignment_var(1)

get_attack_bonus(1)

get_attack_damage(1)

position(1)

get_base_attribute_score(1)

get_date_debut(1)

get_filter(1)

move_to(1)

get_first_name(1)

act_one_episode(1)

get_full_name(1)

get_rect(1)

mover(1)

_from_string(1)

move_towards(1)

has_private_parking(1)

isAlive(1)

get_action_for_train(1)

attack(1)

getArtistByid(1)

decayEligibilities(1)

build_train_op(1)

コード例 #1

ファイルを表示

try:
    with ServerProxy(addr, allow_none=True) as proxy:
        config = proxy.get_actor_config()
        num_episodes = config["num_episodes"]
        episodes_per_update = config["episodes_per_update"]
        eps = config["max_eps"]
        min_eps = config["min_eps"]
        eps_step = config["eps_step"]
        frame_skip_min = config["frame_skip_min"]
        frame_skip_max = config["frame_skip_max"]

        actor = Actor(**config)
        actor.update_policy_net(proxy.get_policy_net().data)

        for i in range(1, num_episodes + 1):
            reward = actor.act_one_episode(eps, frame_skip_min, frame_skip_max)
            if args.verbose:
                print("Episode {0}: Total reward = {1} | eps = {2}".format(
                    i, reward, eps))

            if i % episodes_per_update == 0:
                start_time = time.time()
                policy_net = proxy.add_memories_and_get_policy_net(
                    actor.memory)
                actor.update_policy_net(policy_net.data)
                actor.memory.clear()
                end_time = time.time()
                if args.time:
                    print("Wall time taken to update: {0} sec".format(
                        round(end_time - start_time, 2)))