Python SJTUModel示例

编程语言: Python

命名空间/包名称: sleep_control.env_models

类/类型: SJTUModel

hotexamples.com的示例: 2

Python SJTUModel - 已找到2个示例。这些是从开源项目中提取的最受好评的sleep_control.env_models.SJTUModel现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

SJTUModel(2)

常用方法

SJTUModel (2)

示例#1

显示文件

文件： experiment_DynaQNN_Feb2_0945_dormW.py 项目： zaxliu/dqn4wirelesscontrol

head_datetime = start_time - time_step * backoff_epochs
tail_datetime = head_datetime + total_time
TOTAL_EPOCHS = int(total_time / time_step)
#    |- Reward
rewarding = {'serve': Rs, 'wait': Rw, 'fail': Rf}

te = TrafficEmulator(session_df=session_df,
                     time_step=time_step,
                     head_datetime=head_datetime,
                     tail_datetime=tail_datetime,
                     rewarding=rewarding,
                     verbose=2)

ts = TrafficServer(cost=(Co, Cw), verbose=2)

env_model = SJTUModel(traffic_params, queue_params, reward_params, 2)

agent = Dyna_QAgentNN(
    env_model=env_model,
    num_sim=num_sim,
    # agent = Phi_QAgentNN(
    #     phi_length=phi_length,
    dim_state=dim_state,
    range_state=range_state,
    f_build_net=None,
    batch_size=batch_size,
    learning_rate=learning_rate,
    momentum=momentum,
    reward_scaling=reward_scaling,
    reward_scaling_update=reward_scaling_update,
    rs_period=rs_period,

示例#2

显示文件

文件： test_integration_DynaMixin_SJTUEmulator.py 项目： zhuwenxing/deepnap

num_sim = 10

# Build entities
rewarding = {'serve': Rs, 'wait': Rw, 'fail': Rf}
te = TrafficEmulator(session_df=session_df,
                     time_step=time_step,
                     rewarding=rewarding,
                     verbose=1)

ts = TrafficServer(verbose=2, cost=(Co, Cs))

traffic_params = (model_type, traffic_window_size, stride, n_iter,
                  adjust_offset, eval_period, eval_len, n_belief_bins)
queue_params = (max_queue_len, )
reward_params = (Rs, Rw, Rf, Co, Cs, None)
env_model = SJTUModel(traffic_params, queue_params, reward_params, verbose=1)

agent = DynaQAgent(env_model=env_model,
                   num_sim=num_sim,
                   actions=actions,
                   alpha=0.5,
                   gamma=0.5,
                   explore_strategy='epsilon',
                   epsilon=0.1,
                   verbose=2)
#agent = QAgentNN(dim_state=(1, 1, 3), range_state=((((0, 10), (0, 10), (0, 10),),),),
#                 learning_rate=0.01, reward_scaling=10, batch_size=100, freeze_period=50, memory_size=200, num_buffer=2,
#                 actions=actions, alpha=0.5, gamma=0.5, explore_strategy='epsilon', epsilon=0.1,
#                 verbose=2
#                 )
c = QController(agent=agent)