Python Policy._get_is_training_placeholder Beispiele

Programmiersprache: Python

Namespace / Paketname: ray.rllib.policy

Klasse / Typ: Policy

Methode / Funktion: _get_is_training_placeholder

Beispiele auf hotexamples.com: 2

Python Policy._get_is_training_placeholder - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die ray.rllib.policy.Policy._get_is_training_placeholder, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

__init__(11)

set_weights(5)

q_func_vars(4)

target_q_func_vars(3)

policy_spec(3)

td_error(2)

target_q_model(2)

entropy(2)

get_tower_stats(2)

spl_loss(2)

q_model(2)

_get_is_training_placeholder(2)

target_model(1)

q_values(1)

policy_loss(1)

pi_err(1)

p2sro_policy_spec(1)

model(1)

loss(1)

get_weights(1)

dist_class(1)

compute_single_action(1)

_lazy_tensor_dict(1)

to_log(1)

Beispiel #1

Datei anzeigen

def compute_q_values(policy: Policy,
                     model: ModelV2,
                     obs: TensorType,
                     explore,
                     is_training=None) -> TensorType:
    _is_training = (is_training if is_training is not None else
                    policy._get_is_training_placeholder())
    model_out, _ = model(SampleBatch(obs=obs, _is_training=_is_training), [],
                         None)

    return model_out

Beispiel #2

Datei anzeigen

Datei: simple_q_tf_policy.py Projekt: holdenk/ray

def compute_q_values(policy: Policy,
                     model: ModelV2,
                     obs: TensorType,
                     explore,
                     is_training=None) -> TensorType:
    model_out, _ = model({
        SampleBatch.CUR_OBS: obs,
        "is_training": is_training
        if is_training is not None else policy._get_is_training_placeholder(),
    }, [], None)

    return model_out