Python DeterministicPolicyHead 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tonic.tensorflow.models

메소드/함수: DeterministicPolicyHead

hotexamples.com에서의 예제들: 2

Python DeterministicPolicyHead - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tonic.tensorflow.models.DeterministicPolicyHead에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: ddpg.py 프로젝트: lorenzosteccanella/tonic

def default_model():
    return models.ActorCriticWithTargets(
        actor=models.Actor(encoder=models.ObservationEncoder(),
                           torso=models.MLP((256, 256), 'relu'),
                           head=models.DeterministicPolicyHead()),
        critic=models.Critic(encoder=models.ObservationActionEncoder(),
                             torso=models.MLP((256, 256), 'relu'),
                             head=models.ValueHead()),
        observation_normalizer=normalizers.MeanStd())

예제 #2

파일 보기

def default_model():
    return models.ActorCriticWithTargets(
        actor=models.Actor(encoder=models.ObservationEncoder(),
                           torso=models.MLP((256, 256), 'relu'),
                           head=models.DeterministicPolicyHead()),
        critic=models.Critic(
            encoder=models.ObservationActionEncoder(),
            torso=models.MLP((256, 256), 'relu'),
            # These values are for the control suite with 0.99 discount.
            head=models.DistributionalValueHead(-150., 150., 51)),
        observation_normalizer=normalizers.MeanStd())