Python StreamingTensorNormalizer Beispiele, tf_agents.utils.tensor_normalizer.StreamingTensorNormalizer Python Beispiele

Beispiel #1

0

Datei anzeigen

Datei: tensor_normalizer_test.py Projekt: whghdrms/agents-tutorial

 def setUp(self):
   super(StreamingTensorNormalizerTest, self).setUp()
   tf.compat.v1.reset_default_graph()
   self._tensor_spec = tensor_spec.TensorSpec([3], tf.float32, 'obs')
   self._tensor_normalizer = tensor_normalizer.StreamingTensorNormalizer(
       tensor_spec=self._tensor_spec)
   self._dict_tensor_spec = {'a': self._tensor_spec, 'b': self._tensor_spec}
   self._dict_tensor_normalizer = tensor_normalizer.StreamingTensorNormalizer(
       tensor_spec=self._dict_tensor_spec)
   self.evaluate(tf.compat.v1.global_variables_initializer())

Beispiel #2

0

Datei anzeigen

Datei: tensor_normalizer_test.py Projekt: SubhashPadala/agents

    def testNormalizationFloat64(self):
        spec = tensor_spec.TensorSpec([3], tf.float64, 'obs')
        dict_tensor_spec = {'a': spec, 'b': spec}
        dict_tensor_normalizer = tensor_normalizer.StreamingTensorNormalizer(
            tensor_spec=dict_tensor_spec)
        self.evaluate(tf.compat.v1.global_variables_initializer())

        as_tensor = functools.partial(tf.convert_to_tensor, dtype=tf.float64)
        # Update with some initial values.
        norm_obs = {
            'a': np.random.randn(6, 2, 3),
            'b': np.random.randn(6, 2, 3)
        }
        norm_obs_t = tf.nest.map_structure(as_tensor, norm_obs)

        self.evaluate(dict_tensor_normalizer.update(norm_obs_t))

        view_obs = {'a': np.random.randn(4, 3), 'b': np.random.randn(4, 3)}
        view_obs_t = tf.nest.map_structure(as_tensor, view_obs)

        observed = self.evaluate(
            dict_tensor_normalizer.normalize(view_obs_t,
                                             clip_value=-1,
                                             variance_epsilon=1e-6))

        norm_obs_avg = tf.nest.map_structure(lambda a: a.mean(axis=(0, 1)),
                                             norm_obs)
        norm_obs_std = tf.nest.map_structure(lambda a: a.std(axis=(0, 1)),
                                             norm_obs)
        expected = tf.nest.map_structure(
            lambda obs, avg, std: (obs - avg) / std, view_obs, norm_obs_avg,
            norm_obs_std)

        self.assertAllClose(observed, expected)

Beispiel #3

0

Datei anzeigen

    def __init__(self,
                 optimizer=None,
                 mod_net=None,
                 observation_spec=None,
                 discount_factor=0.95,
                 num_epochs=15,
                 normalize_rewards=False,
                 reward_norm_clipping=10.0,
                 gradient_clipping=None,
                 name=None):
        tf.Module.__init__(self, name=name)
        self._optimizer = optimizer
        self._mod_net = mod_net
        self._discount_factor = discount_factor
        self._num_epochs = num_epochs
        self._reward_norm_clipping = reward_norm_clipping
        self._gradient_clipping = gradient_clipping or 0.0
        self._observation_spec = observation_spec
        self._reward_normalizer = None
        if normalize_rewards:
            self._reward_normalizer = tensor_normalizer.StreamingTensorNormalizer(
                tensor_spec.TensorSpec([], tf.float32),
                scope='normalize_reward')

        super(CatDQNTrainer, self).__init__()

Beispiel #4

0

Datei anzeigen