Python concat_batches примеры использования

Язык программирования: Python

Пространство имен/Пакет: slm_lab.lib.util

Метод/Функция: concat_batches

Примеров на hotexamples.com: 10

Python concat_batches - 10 примеров найдено. Это лучшие примеры Python кода для slm_lab.lib.util.concat_batches, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: sil.py Проект: ronald-xie/SLM-Lab

 def replay_sample(self):
     '''Samples a batch from memory'''
     batches = [body.replay_memory.sample() for body in self.agent.nanflat_body_a]
     batch = util.concat_batches(batches)
     batch = util.to_torch_batch(batch, self.net.gpu)
     assert not torch.isnan(batch['states']).any()
     return batch

Пример #2

Показать файл

Файл: sil.py Проект: shlpu/SLM-Lab

 def replay_sample(self):
     '''Samples a batch from memory'''
     batches = [
         body.replay_memory.sample() for body in self.agent.nanflat_body_a
     ]
     batch = util.concat_batches(batches)
     batch = util.to_torch_batch(batch, self.net.gpu)
     assert not torch.isnan(batch['states']).any()
     return batch

Пример #3

Показать файл

Файл: sil.py Проект: shlpu/SLM-Lab

 def sample(self):
     '''Modify the onpolicy sample to also append to replay'''
     batches = [body.memory.sample() for body in self.agent.nanflat_body_a]
     batch = util.concat_batches(batches)
     data_keys = self.body.replay_memory.data_keys
     for idx in range(len(batch['dones'])):
         tuples = [batch[k][idx] for k in data_keys]
         self.body.replay_memory.add_experience(*tuples)
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch

Пример #4

Показать файл

Файл: sil.py Проект: ronald-xie/SLM-Lab

 def sample(self):
     '''Modify the onpolicy sample to also append to replay'''
     batches = [body.memory.sample() for body in self.agent.nanflat_body_a]
     batch = util.concat_batches(batches)
     data_keys = self.body.replay_memory.data_keys
     for idx in range(len(batch['dones'])):
         tuples = [batch[k][idx] for k in data_keys]
         self.body.replay_memory.add_experience(*tuples)
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch

Пример #5

Показать файл

 def space_sample(self):
     '''Samples a batch from memory'''
     batches = []
     for body in self.agent.nanflat_body_a:
         self.body = body
         batches.append(self.sample())
     # set body reference back to default
     self.body = self.agent.nanflat_body_a[0]
     batch = util.concat_batches(batches)
     batch = util.to_torch_batch(batch, self.net.device, self.body.memory.is_episodic)
     return batch

Пример #6

Показать файл

 def sample(self):
     '''Samples a batch from memory of size self.memory_spec['batch_size']'''
     batches = []
     for body in self.agent.nanflat_body_a:
         body_batch = body.memory.sample()
         # one-hot actions to calc q_targets
         if body.is_discrete:
             body_batch['actions'] = util.to_one_hot(body_batch['actions'], body.action_space.high)
         batches.append(body_batch)
     batch = util.concat_batches(batches)
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch

Пример #7

Показать файл

Файл: sarsa.py Проект: ronald-xie/SLM-Lab

 def sample(self):
     '''Samples a batch from memory'''
     batches = []
     for body in self.agent.nanflat_body_a:
         body_batch = body.memory.sample()
         # one-hot actions to calc q_targets
         if body.is_discrete:
             body_batch['one_hot_actions'] = util.to_one_hot(body_batch['actions'], body.action_space.high)
         batches.append(body_batch)
     batch = util.concat_batches(batches)
     # this is safe for next_action at done since the calculated act_next_q_preds will be multiplied by (1 - batch['dones'])
     batch['next_actions'] = np.zeros_like(batch['actions'])
     batch['next_actions'][:-1] = batch['actions'][1:]
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch

Пример #8

Показать файл

Файл: sarsa.py Проект: dantodor/SLM-Lab

 def sample(self):
     '''Samples a batch from memory'''
     batches = []
     for body in self.agent.nanflat_body_a:
         body_batch = body.memory.sample()
         # one-hot actions to calc q_targets
         if body.is_discrete:
             body_batch['one_hot_actions'] = util.to_one_hot(body_batch['actions'], body.action_space.high)
         batches.append(body_batch)
     batch = util.concat_batches(batches)
     # this is safe for next_action at done since the calculated act_next_q_preds will be multiplied by (1 - batch['dones'])
     batch['next_actions'] = np.zeros_like(batch['actions'])
     batch['next_actions'][:-1] = batch['actions'][1:]
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch

Пример #9

Показать файл

Файл: reinforce.py Проект: kevin83919/SLM-Lab

 def sample(self):
     '''Samples a batch from memory'''
     batches = [body.memory.sample() for body in self.agent.nanflat_body_a]
     batch = util.concat_batches(batches)
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch

Пример #10

Показать файл

Файл: actor_critic.py Проект: ronald-xie/SLM-Lab

 def sample(self):
     '''Samples a batch from memory'''
     batches = [body.memory.sample() for body in self.agent.nanflat_body_a]
     batch = util.concat_batches(batches)
     batch = util.to_torch_batch(batch, self.net.gpu)
     return batch