Python OneRoundExp示例

编程语言: Python

命名空间/包名称: Control_Exp1001.demo.thickener_chinese.common.one_round_exp

类/类型: OneRoundExp

hotexamples.com的示例: 5

Python OneRoundExp - 已找到5个示例。这些是从开源项目中提取的最受好评的Control_Exp1001.demo.thickener_chinese.common.one_round_exp.OneRoundExp现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

OneRoundExp(5)

常用方法

OneRoundExp (5)

示例#1

显示文件

文件： hdp_replay.py 项目： qyxlxr/Control_Exp1001

def run_hdp(
    rounds=1000,
    seed=random.randint(0, 1000000),
    name='VI',
    capacity=2,
    batch_size=2,
    predict_round=3000,
    u_optim='adam',
):

    print('seed :', seed)
    torch.manual_seed(seed)
    np.random.seed(seed)
    random.seed(seed)

    vi = new_hdp(capacity=capacity, batch_size=batch_size)
    penalty = Quadratic(**penalty_para)
    env_vi = Thickener(
        penalty_calculator=penalty,
        **thickner_para,
    )

    res1 = OneRoundExp(controller=vi,
                       env=env_vi,
                       max_step=rounds,
                       exp_name=name).run()

    return res1

示例#2

显示文件

文件： vi_hdp_dhp.py 项目： qyxlxr/Control_Exp1001

def run_dhp(
    rounds=800,
    seed=random.randint(0, 1000000),
    name='DHP',
    capacity=2,
    predict_round=3000,
    u_optim='adam',
):

    #seed = 8312279
    print('seed :', seed)
    torch.manual_seed(seed)
    random.seed(seed)
    np.random.seed(seed)
    dhp = new_dhp()
    penalty = Quadratic(**penalty_para)
    env_dhp = Thickener(
        penalty_calculator=penalty,
        **thickner_para,
    )

    res1 = OneRoundExp(controller=dhp,
                       env=env_dhp,
                       max_step=rounds,
                       exp_name=name).run()
    return res1

示例#3

显示文件

文件： vi_hdp_dhp.py 项目： qyxlxr/Control_Exp1001

def run_vi(
    rounds=1000,
    seed=random.randint(0, 1000000),
    name='VI',
    capacity=2,
    predict_round=3000,
    u_optim='adam',
):

    print('seed :', seed)
    torch.manual_seed(seed)
    random.seed(seed)
    np.random.seed(seed)
    vi_para = {'gamma': 0.2}
    vi = new_vi()
    penalty = Quadratic(**penalty_para)
    env_vi = Thickener(
        penalty_calculator=penalty,
        **thickner_para,
    )

    res1 = OneRoundExp(controller=vi,
                       env=env_vi,
                       max_step=rounds,
                       exp_name=name).run()
    print(name, ':', vi.u_iter_times * 1.0 / rounds)

    return res1

示例#4

显示文件

文件： ILPL_only.py 项目： qyxlxr/Control_Exp1001

def run_ILPL(rounds=1000,
             seed=random.randint(0, 1000000),
             name='ILPL',
             predict_round=800):
    print('seed :', seed)
    torch.manual_seed(seed)
    random.seed(seed)
    np.random.seed(seed)
    ilpl = new_ILPL()
    penalty = Quadratic(**penalty_para)
    env_ILPL = Thickener(
        penalty_calculator=penalty,
        **thickner_para,
    )

    res1 = OneRoundExp(controller=ilpl,
                       env=env_ILPL,
                       max_step=rounds,
                       exp_name=name).run()
    return res1

示例#5

显示文件

def run_hdp(rounds=1000,
            seed=random.randint(0, 1000000),
            name='HDP',
            predict_round=800):
    print('seed :', seed)
    hdp_para = {'gamma': 0.2}

    torch.manual_seed(seed)
    hdp = new_hdp()
    penalty = Quadratic(**penalty_para)

    env_hdp = Thickener(
        penalty_calculator=penalty,
        **thickner_para,
    )

    res1 = OneRoundExp(controller=hdp,
                       env=env_hdp,
                       max_step=rounds,
                       exp_name=name).run()
    return res1