Python DQNAgent.load_checkpoint示例

编程语言: Python

命名空间/包名称: Agents.DQN.DQN

类/类型: DQNAgent

方法/功能: load_checkpoint

hotexamples.com的示例: 2

Python DQNAgent.load_checkpoint - 已找到2个示例。这些是从开源项目中提取的最受好评的Agents.DQN.DQN.DQNAgent.load_checkpoint现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

DQNAgent(4)

getPolicy(4)

testPolicyNet(3)

load_checkpoint(2)

policyNet(2)

__init__(1)

select_action(1)

train(1)

示例#1

显示文件

                 torch.nn.MSELoss(reduction='none'),
                 N_A,
                 stateProcessor=stateProcessor,
                 experienceProcessor=experienceProcessor)

trainFlag = True
testFlag = True

if trainFlag:

    if config['loadExistingModel']:
        checkpoint = torch.load(config['saveModelFile'])
        agent.policyNet.load_state_dict(checkpoint['model_state_dict'])
        agent.optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
    if config['loadCheckpointFlag']:
        agent.load_checkpoint(config['loadCheckpointPrefix'])

    plotPolicyFlag = True
    if plotPolicyFlag:

        for phiIdx in range(8):
            phi = phiIdx * np.pi / 4.0
            policy = deepcopy(env.mapMat).astype(np.long)
            value = deepcopy(env.mapMat)
            for i in range(policy.shape[0]):
                for j in range(policy.shape[1]):
                    if env.mapMat[i, j] == 1:
                        policy[i, j] = -1
                        value[i, j] = -1
                    else:
                        sensorInfo = env.agent.getSensorInfoFromPos(

示例#2

显示文件

                 stateProcessor=stateProcessor, config=config)



trainFlag = True
testFlag = True

if trainFlag:

    if config['loadExistingModel']:
        checkpoint = torch.load(config['saveModelFile'])
        agent.policyNet.load_state_dict(checkpoint['model_state_dict'])
        agent.optimizer.load_state_dict(checkpoint['optimizer_state_dict'])

    if config['loadCheckpoint']:
        agent.load_checkpoint(config['checkpointTag'])

    plotPolicyFlag = True
    if plotPolicyFlag:

        for phiIdx in range(8):
            phi = phiIdx * np.pi/4.0
            policy = deepcopy(env.mapMat)
            for i in range(policy.shape[0]):
                  for j in range(policy.shape[1]):
                      if env.mapMat[i, j] == 1:
                          policy[i, j] = -1
                      else:
                          sensorInfo = env.agent.getSensorInfoFromPos(np.array([i, j, phi]))
                          distance = np.array(config['targetState']) - np.array([i, j])
                          dx = distance[0] * math.cos(phi) + distance[1] * math.sin(phi)