Python Policy._get_is_training_placeholderの例

プログラミング言語: Python

名前空間/パッケージ名: ray.rllib.policy

クラス/型: Policy

メソッド/関数: _get_is_training_placeholder

hotexamples.comのコード掲載数: 2

Python Policy._get_is_training_placeholder - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのray.rllib.policy.Policy._get_is_training_placeholderの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

__init__(11)

set_weights(5)

q_func_vars(4)

target_q_func_vars(3)

policy_spec(3)

td_error(2)

target_q_model(2)

entropy(2)

get_tower_stats(2)

spl_loss(2)

q_model(2)

_get_is_training_placeholder(2)

target_model(1)

q_values(1)

policy_loss(1)

pi_err(1)

p2sro_policy_spec(1)

model(1)

loss(1)

get_weights(1)

dist_class(1)

compute_single_action(1)

_lazy_tensor_dict(1)

to_log(1)

コード例 #1

ファイルを表示

def compute_q_values(policy: Policy,
                     model: ModelV2,
                     obs: TensorType,
                     explore,
                     is_training=None) -> TensorType:
    _is_training = (is_training if is_training is not None else
                    policy._get_is_training_placeholder())
    model_out, _ = model(SampleBatch(obs=obs, _is_training=_is_training), [],
                         None)

    return model_out

コード例 #2

ファイルを表示

ファイル: simple_q_tf_policy.py プロジェクト: holdenk/ray

def compute_q_values(policy: Policy,
                     model: ModelV2,
                     obs: TensorType,
                     explore,
                     is_training=None) -> TensorType:
    model_out, _ = model({
        SampleBatch.CUR_OBS: obs,
        "is_training": is_training
        if is_training is not None else policy._get_is_training_placeholder(),
    }, [], None)

    return model_out