Python DeterministicWithLogProb Beispiele

Programmiersprache: Python

Namespace / Paketname: tf_agents.policies.greedy_policy

Methode / Funktion: DeterministicWithLogProb

Beispiele auf hotexamples.com: 2

Python DeterministicWithLogProb - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die tf_agents.policies.greedy_policy.DeterministicWithLogProb, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

      def dist_fn(dist):
        try:
          greedy_action = dist.mode()
        except NotImplementedError:
          raise ValueError("Your network's distribution does not implement "
                           "mode making it incompatible with a greedy policy.")

        return greedy_policy.DeterministicWithLogProb(loc=greedy_action)

Beispiel #2

Datei anzeigen

    def deterministic_action_distribution(self, time_step):
        """
        Produce a deterministic tfp.distribution centered on the action
        from the current table.

        """
        obs = time_step.observation
        action = self.table_lookup(obs)
        return greedy_policy.DeterministicWithLogProb(loc=action)