Esempi in Python per DQN.ImageProcess

Linguaggio di programmazione: Python

Classe/tipologia: DQN

Metodo/funzione: ImageProcess

Esempi su hotexamples.com: 2

DQN.ImageProcess in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per DQN.ImageProcess da pachetto acme, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DQN(30)

Agent(6)

DQNAgent(4)

DQN_Agent(2)

Mynet(2)

Memory(2)

ImageProcess(2)

ZeroGamaDQN(2)

DQNPlayer(2)

DQNT(1)

Choose_Action_EpsilonGreedy(1)

Transition(1)

Train(1)

ReplyMemory(1)

Q_Learning(1)

QNetwork(1)

Pw_Agent(1)

NoisyDQN(1)

DQNMethod(1)

DQN_VR(1)

IRL_helper(1)

GraphNet(1)

Cartpole(1)

Deep_Q_Learning(1)

DeepQNetwork(1)

DQNplayer(1)

DQNmodel(1)

Environment(1)

Esempio n. 1

Mostra file

 def __init__(self):
     env = gym.envs.make("PongDeterministic-v4")
     self.Q_target = DQN.Mynet(env.observation_space, env.action_space).to(device)
     self.Q_policy = DQN.Mynet(env.observation_space, env.action_space).to(device)
     self.Q_target.load_state_dict(self.Q_policy.state_dict())
     self.Q_target.eval()
     self.env = env
     self.pool = DQN.ReplyMemory(15000)
     self.gramma = GRAMMA
     self.alpha = ALPHA
     self.epsilon = EPSILON
     self.ImageProcess = DQN.ImageProcess()

Esempio n. 2

Mostra file

    return torch.cat(obb).to(device).unsqueeze(0)


if __name__ == '__main__':
    env = gym.envs.make("PongDeterministic-v4")

    V = DQN.Mynet(env.observation_space, env.action_space)
    # V = DQN.Mynet()
    # with open('./save_model/499.pt', 'r') as f:
    V.load_state_dict(torch.load(r'C:\Users\lingse\Desktop\新建文件夹\RL_home_work-master\Q_save_model\899_pong_new.pt'))
    V.eval()
    observation = [None for i in range(5)]
    import numpy as np

    # c = V(state).max(1)[1].view(1, 1)
    I = DQN.ImageProcess()
    while True:
        state = env.reset()
        state = I.ColorMat2Binary(state)
        state_shadow = np.stack((state, state, state, state), axis=2)
        state_now = transfor_o(state_shadow)
        import time
        while True:
            env.render()
            time.sleep(0.01)
            action = V(state_now).max(1)[1].view(1, 1)
            if action[0][0] == 0:
                do_action = [[2]]
            else:
                do_action = [[5]]
            observation1, reward, done, _ = env.step(do_action)