Python make_imitation_env示例

编程语言: Python

命名空间/包名称: wrappers.imitation_wrapper

方法/功能: make_imitation_env

hotexamples.com的示例: 6

Python make_imitation_env - 已找到6个示例。这些是从开源项目中提取的最受好评的wrappers.imitation_wrapper.make_imitation_env现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： ob_copy_oracle.py 项目： ncnynl/f110_Imitation-Learning

 def __init__(self):
     self.serv_sender = ExperienceSender()
     self.record = False
     self.env = make_imitation_env(skip=3)
     self.oracle = FGM()
     
     #store observations for sender (sending off to server for training)
     self.sender_buffer = deque(maxlen=100)

示例#2

显示文件

 def __init__(self):
     self.model = NVIDIA_ConvNet().to(device)
     self.update_nn()
     self.model.eval()
     self.oracle = FGM()
     self.serv_sender = ExperienceSender()
     self.repbuf = f110_ReplayBuffer()
     self.record = False
     self.send = False
     self.env = make_imitation_env()

示例#3

显示文件

文件： ob_copy_oracle.py 项目： ncnynl/f110_Imitation-Learning

 def run_policy(self):
     """ Uses self.oracle to run the policy onboard"""
     env = make_imitation_env(skip=2)
     obs_dict = env.reset()
     self.sender_buffer.append(obs_dict)
     while True:
         action = self.get_action(obs_dict)
         nobs_dict, reward, done, info = env.step(action)
         if info.get("record"):
             self.sender_buffer.append(nobs_dict)
         obs_dict = nobs_dict
         if done:
             obs_dict = env.reset()

示例#4

显示文件

def main():
    env = make_imitation_env(skip=2)
    #env = f110Env()
    obs = env.reset()
    count = 0
    while True:
        random_action = {"angle":0.2, "speed":1.0}
        obs, reward, done, info = env.step(random_action)
        cv_img = obs["img"]
        cv2.imshow('latestimg', cv_img)
        cv2.waitKey(2)
	    count+=1
        if done:
            print("ISDONE")
            obs = env.reset()

示例#5

显示文件

    def run_policy(self):
        """ Uses self.model to run the policy onboard & adds experiences to the replay buffer """
        env = make_imitation_env(skip=3)
        obs_dict = env.reset()
        while True:
            action = self.get_action(self.gymobs_to_inputdict(obs_dict))
            next_obs_dict, reward, done, info = env.step(action)
            if info.get("record"):
                self.record = True
                ret_dict = self.oracle.fix(obs_dict)
                self.repbuf.add(ret_dict, action, reward, done)
            else:
                self.record = False

            if info.get("buttons")[0]:
                self.send = True
            else:
                self.send = False
            obs_dict = next_obs_dict
            if done:
                obs_dict = env.reset()

示例#6

显示文件

文件： ob_prioritized-ssil.py 项目： ncnynl/f110_Imitation-Learning

    def run_policy(self):
        """ Uses self.model to run the policy onboard & adds experiences to the prioritized replay buffer """
        env = make_imitation_env()
        obs_dict = env.reset()
        while True:
            action = self.get_action(self.gymobs_to_inputdict(obs_dict))
            next_obs_dict, reward, done, info = env.step(action)
            if info.get("record"):
                self.record = True
                entry = self.get_repbuf_entry(obs_dict, action, next_obs_dict,
                                              reward, done, info)
                self.repbuf.add(*entry)
            else:
                self.record = False

            if info.get("buttons")[0] == 1:
                self.send = True
            else:
                self.send = False
            obs_dict = next_obs_dict
            if done:
                obs_dict = env.reset()