Python Updater.calc_lossの例

プログラミング言語: Python

名前空間/パッケージ名: updater

クラス/型: Updater

メソッド/関数: calc_loss

hotexamples.comのコード掲載数: 2

Python Updater.calc_loss - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのupdater.Updater.calc_lossの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Updater(30)

do_update(5)

download_tarball(5)

get_tarball_url(4)

add_info(3)

entr_coef(2)

blank_line(2)

epsilon(2)

apply_patch_check(2)

apply_patch(2)

check_device(2)

delete(2)

check(2)

check_update(2)

add(2)

calc_loss(2)

end_table_connect(1)

empty(1)

download_update(1)

done(1)

doesEntryListContain(1)

do_update_phase2(1)

evaluate(1)

fetch_update(1)

execute(1)

fetch_countries(1)

firstUpdate(1)

getResult(1)

get_ip(1)

get_updated_addons(1)

remove(1)

runrequest(1)

set_zone_ip(1)

sprites(1)

updateFile(1)

update_ips(1)

do_update_phase1(1)

Client(1)

doUpdate(1)

addSuppress(1)

ExecUpd(1)

abort(1)

addClass(1)

addFilter(1)

addGenerator(1)

addMessage(1)

addReference(1)

addReferenceType(1)

addRule(1)

addRuleSet(1)

コード例 #1

ファイルを表示

ファイル: debug_entry.py プロジェクト: grantsrb/Exploratory-MultiAgent-Snake

                  lr,
                  entropy_const=entropy_const,
                  value_const=val_const,
                  gamma=gamma,
                  _lambda=_lambda,
                  max_norm=max_norm,
                  norm_advs=norm_advs)

if resume:
    updater.net.load_state_dict(torch.load(exp_name + '_net.p'))
    updater.optim.load_state_dict(torch.load(exp_name + '_optim.p'))
updater.optim.zero_grad()

epoch = 0
while True:
    epoch += 1
    print("Begin Epoch", epoch, "– T =", collector.T)
    for rollout in range(n_rollouts):
        data = collector.get_data(render)
        updater.calc_loss(*data, gae, reinforce)
    updater.update_model()
    updater.save_model(net_save_file, optim_save_file)
    updater.print_statistics()
    print("Grad Norm:", updater.norm, "– Avg Action:", np.mean(data[3]))
    print("Average Reward:", collector.avg_reward, end='\n\n')

    # Check for memory leaks
    gc.collect()
    max_mem_used = resource.getrusage(resource.RUSAGE_SELF).ru_maxrss
    print("Memory Used: {:.2f} memory\n".format(max_mem_used / 1024))

コード例 #2

ファイルを表示

T = 0
avg_rew = 0.5
epoch = 0
trial = 0

while T < total_steps:
    epoch += 1
    # Collect Rollout
    data = collector.rollout(n_tsteps)
    avg_rew = .99 * avg_rew + .01 * np.mean(data['rewards'])
    T += n_tsteps * n_envs
    # Update Model
    if evaluate_mode:
        logger.data["Trial " + str(epoch)] = np.asarray(data['rewards'])
    else:
        updater.calc_loss(data)
        if epoch % epochs_per_update == 0:
            print("\nStep:", T, " – Epoch", epoch)
            avg_val = np.mean(data['values'])
            avg_action = np.mean(data['sparse_actions'])
            print("Avg Rew:", avg_rew, " – Avg Act:", avg_action,
                  " – Avg Val:", avg_val)
            updater.update_model(calc_grad=True)

            # Track Stats
            updater.print_stats()
            updater.info["Avg Reward"] = avg_rew
            updater.info["Avg Action"] = avg_action
            updater.info["Avg Value Pred"] = avg_val
            logger.append(updater.info, x_val=T)
            updater.save_model(save_file)