Python get_base_ppo_conf 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rl.conf

메소드/함수: get_base_ppo_conf

hotexamples.com에서의 예제들: 5

Python get_base_ppo_conf - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rl.conf.get_base_ppo_conf에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def get_conf():
    lr = 3e-5

    return {
        **get_base_ppo_conf(num_workers=10),
        'lr': lr,
        'env_config': ENV_CONF_COMMUNISM,
    }

예제 #2

파일 보기

def get_conf():
    lr = 1e-4

    return {
        **get_base_ppo_conf(num_workers=10),
        "lr_schedule": [
            [0, lr],
            [10_000_000, lr],
            [15_000_000, 0],
        ],
    }

예제 #3

파일 보기

def get_conf():
    lr = 1e-4

    return {
        **get_base_ppo_conf(num_workers=10), 'lr_schedule': [
            [0, lr],
            [10_000_000, lr],
            [15_000_000, 0],
        ],
        'framework':
        'torch'
    }

예제 #4

파일 보기

파일: train_lstm.py 프로젝트: akirasosa/aie-train

def get_conf():
    return {
        **get_base_ppo_conf(num_workers=10),
        "sgd_minibatch_size": 3000,  # 60 * 200 * 4 / 3000 = 16 steps of (B=60, L=50, dim)

        "lr": 3e-4,

        "multiagent": {
            "policies_to_train": ["learned"],
            "policies": {
                "learned": (None, OBS_SPACE_AGENT, ACT_SPACE_AGENT, {
                    "model": {
                        "custom_model": "my_model",
                        'max_seq_len': 50,
                    },
                }),
            },
            "policy_mapping_fn": lambda x: 'learned',
        },
    }

예제 #5

파일 보기

def get_conf():
    return {
        **get_base_ppo_conf(num_workers=10),
        'vf_loss_coeff': 0.1,
        'env_config': ENV_CONF_DYSTOPIA,
    }