Python frameの例

プログラミング言語: Python

名前空間/パッケージ名: lib.epsilon_tracker

メソッド/関数: frame

hotexamples.comのコード掲載数: 3

Python frame - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlib.epsilon_tracker.frameの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: 02 - DQN Dueling.py プロジェクト: utilForever/2021-HYU-HAI-RLBootCamp

    def process_batch(engine_for_batch, batch):
        optimizer.zero_grad()

        loss_v = utils.calc_loss_dqn(batch, net, target_net.target_model, gamma=params.gamma, device=device)
        loss_v.backward()

        optimizer.step()
        epsilon_tracker.frame(engine_for_batch.state.iteration)

        if engine_for_batch.state.iteration % params.target_net_sync == 0:
            target_net.sync()

        if engine.state.iteration % EVAL_EVERY_FRAME == 0:
            eval_states = getattr(engine.state, "eval_states", None)

            if eval_states is None:
                eval_states = buffer.sample(STATES_TO_EVALUATE)
                eval_states = [np.array(transition.state, copy=False) for transition in eval_states]
                eval_states = np.array(eval_states, copy=False)
                engine.state.eval_states = eval_states

            evaluate_states(eval_states, net, device, engine)

        return {
            "loss": loss_v.item(),
            "epsilon": selector.epsilon,
        }

コード例 #2

ファイルを表示

ファイル: 05 - DQN PER.py プロジェクト: utilForever/2021-HYU-HAI-RLBootCamp

    def process_batch(engine_for_batch, batch_data):
        batch, batch_indices, batch_weights = batch_data

        optimizer.zero_grad()

        loss_v, sample_priority = calc_loss(batch,
                                            batch_weights,
                                            net,
                                            target_net.target_model,
                                            gamma=params.gamma,
                                            _device=str(device))
        loss_v.backward()

        optimizer.step()
        buffer.update_priorities(batch_indices, sample_priority)
        epsilon_tracker.frame(engine_for_batch.state.iteration)

        if engine_for_batch.state.iteration % params.target_net_sync == 0:
            target_net.sync()

        return {
            "loss": loss_v.item(),
            "epsilon": selector.epsilon,
            "beta": buffer.update_beta(engine.state.iteration),
        }

コード例 #3

ファイルを表示

ファイル: 01 - DQN Basic.py プロジェクト: utilForever/2021-HYU-HAI-RLBootCamp

    def process_batch(engine_for_batch, batch):
        optimizer.zero_grad()

        loss_v = utils.calc_loss_dqn(batch, net, target_net.target_model, gamma=params.gamma, device=device)
        loss_v.backward()

        optimizer.step()
        epsilon_tracker.frame(engine_for_batch.state.iteration)

        if engine_for_batch.state.iteration % params.target_net_sync == 0:
            target_net.sync()

        return {
            "loss": loss_v.item(),
            "epsilon": selector.epsilon,
        }