Python GumbelSoftmax примеры использования

Язык программирования: Python

Пространство имен/Пакет: tf_agents.distributions.gumbel_softmax

Метод/Функция: GumbelSoftmax

Примеров на hotexamples.com: 3

Python GumbelSoftmax - 3 примера найдено. Это лучшие примеры Python кода для tf_agents.distributions.gumbel_softmax.GumbelSoftmax, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

 def testMode(self):
   temperature = 1.0
   logits = [.3, .1, .4]
   dist = gumbel_softmax.GumbelSoftmax(
       temperature, logits, validate_args=True)
   self.assertAllEqual(self.evaluate(dist.mode()),
                       self.evaluate(tf.constant([0, 0, 1])))

Пример #2

Показать файл

 def testSample(self):
   temperature = 0.8
   logits = [.3, .1, .4]
   dist = gumbel_softmax.GumbelSoftmax(
       temperature, logits, dtype=tf.int64, validate_args=True)
   actions = dist.convert_to_one_hot(dist.sample())
   self.assertEqual(actions.dtype, tf.int64)
   self.assertEqual(self.evaluate(tf.reduce_sum(actions, axis=-1)), 1)

Пример #3

Показать файл

 def testLogProb(self):
   temperature = 0.8
   logits = [.3, .1, .4]
   dist = gumbel_softmax.GumbelSoftmax(
       temperature, logits, validate_args=True)
   x = tf.constant([0, 0, 1])
   log_prob = self.evaluate(dist.log_prob(x))
   expected_log_prob = -0.972918868065
   self.assertAllClose(expected_log_prob, log_prob)