Esempi in Python per create_ac_algorithm

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: alf.algorithms.actor_critic_algorithm

Metodo/funzione: create_ac_algorithm

Esempi su hotexamples.com: 6

create_ac_algorithm in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per alf.algorithms.actor_critic_algorithm.create_ac_algorithm, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Esempio n. 1

Mostra file

def _create_ppo_algorithm(env):
    return create_ac_algorithm(env=env,
                               actor_fc_layers=(),
                               value_fc_layers=(),
                               use_rnns=True,
                               learning_rate=1e-3,
                               algorithm_class=PPOAlgorithm)

Esempio n. 2

Mostra file

def create_ppo_algorithm(env, debug_summaries=False):
    """Create a simple PPOAlgorithm.

    Args:
        env (TFEnvironment): A TFEnvironment
        debug_summaries (bool): True if debug summaries should be created.
    """
    algorithm = create_ac_algorithm(env, debug_summaries=debug_summaries)
    return PPOAlgorithm(algorithm)

Esempio n. 3

Mostra file

File: ppo_algorithm.py Progetto: zhaoyinfu123/alf

def create_ppo_algorithm(env, debug_summaries=False):
    """Create a simple PPOAlgorithm.

    Args:
        env (TFEnvironment): A TFEnvironment
        debug_summaries (bool): True if debug summaries should be created.
    Returns:
        PPOAlgorithm
    """
    return create_ac_algorithm(env,
                               algorithm_class=PPOAlgorithm,
                               loss_class=PPOLoss,
                               debug_summaries=debug_summaries)

Esempio n. 4

Mostra file

def _create_ac_algorithm(env):
    return create_ac_algorithm(env=env,
                               actor_fc_layers=(8, ),
                               value_fc_layers=(8, ))

Esempio n. 5

Mostra file

File: off_policy_driver_test.py Progetto: mathkobe/alf

def _create_ac_algorithm(env):
    return OffPolicyAdapter(
        create_ac_algorithm(env=env,
                            actor_fc_layers=(8, ),
                            value_fc_layers=(8, )))

Esempio n. 6

Mostra file

File: off_policy_driver_test.py Progetto: mathkobe/alf

def _create_ppo_algorithm(env):
    return PPOAlgorithm(
        create_ac_algorithm(env=env,
                            actor_fc_layers=(16, 16),
                            value_fc_layers=(16, 16),
                            learning_rate=1e-3))