Python farmer_class示例

编程语言: Python

命名空间/包名称: remote_env.farmer

方法/功能: farmer_class

hotexamples.com的示例: 4

Python farmer_class - 已找到4个示例。这些是从开源项目中提取的最受好评的remote_env.farmer.farmer_class现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： on_policy_rollouts.py 项目： yychrzh/parallel_rl

 def __init__(self, agent, env=None):
     self.lock = th.Lock()
     self.agent = agent
     # one and only
     self.para_list = self.get_parameter_list()
     self.farmer = farmer_class(self.para_list)
     self.ep_num = 0
     self.total_steps = 0
     self.history_reward = []
     self.ep_value = {}
     self.value_init()
     self.relative_time = 0
     self.average_len_of_episode = self.agent.args.max_pathlength
     self.num_rollouts = int(self.agent.args.timesteps_per_batch /
                             self.average_len_of_episode)
     self.rollout_count = 0
     self.rollout_paths = []
     self.iteration = 0
     self.log_scalar_name_list = [
         'reward', 'kl_div', 'entropy', 'surrogate_loss', 'value_loss'
     ]
     self.log_scalar_type_list = [
         tf.float32, tf.float32, tf.float32, tf.float32, tf.float32
     ]
     self.logger = Logger(self.agent.session,
                          self.agent.args.log_path + 'train',
                          self.log_scalar_name_list,
                          self.log_scalar_type_list)
     self.write_log = self.logger.create_scalar_log_method()
     self.start_time = time.time()

示例#2

显示文件

文件： ddpg_rollouts.py 项目： yychrzh/parallel_rl

 def __init__(self, agent, env=None):
     self.lock = th.Lock()
     self.agent = agent
     # one and only
     self.para_list = self.get_parameter_list()
     self.farmer = farmer_class(self.para_list)
     self.ep_num = 0
     self.total_steps = 0
     self.history_reward = []
     self.ep_value = {}
     self.value_init()
     self.relative_time = 0
     self.average_steps = self.agent.args.max_pathlength
     self.start_time = time.time()

示例#3

显示文件

 def __init__(self, agent, env=None):
     self.lock = th.Lock()
     self.agent = agent
     # one and only
     self.farmer = farmer_class(self.agent.para_list)
     self.ep_num = 0
     self.total_steps = 0
     self.history_reward = []
     self.ep_value = {}
     self.value_init()
     self.relative_time = 0
     self.average_steps = self.agent.para_list["max_pathlength"]
     self.log_scalar_name_list = [
         'mean_reward', 'actor_loss', 'critic_loss'
     ]
     self.log_scalar_type_list = [tf.float32, tf.float32, tf.float32]
     self.logger = Logger(self.agent.session,
                          self.agent.para_list["log_path"] + 'train',
                          self.log_scalar_name_list,
                          self.log_scalar_type_list)
     self.write_log = self.logger.create_scalar_log_method()
     self.start_time = time.time()

示例#4

显示文件

文件： ddpg_rollouts.py 项目： yychrzh/parallel_rl

 def refarm(self):  # most time no use
     del self.farmer
     self.farmer = farmer_class()