Python deduped_network_variables 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tf_agents.utils.common

메소드/함수: deduped_network_variables

hotexamples.com에서의 예제들: 3

Python deduped_network_variables - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tf_agents.utils.common.deduped_network_variables에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: td3_agent.py 프로젝트: MitchellTesla/google-research

      def update():  # pylint: disable=missing-docstring
        # TODO(b/124381161): What about observation normalizer variables?
        critic_update_1 = common.soft_variables_update(
            self._critic_network_1.variables,
            self._target_critic_network_1.variables,
            tau,
            tau_non_trainable=1.0)

        critic_2_update_vars = common.deduped_network_variables(
            self._critic_network_2, self._critic_network_1)
        target_critic_2_update_vars = common.deduped_network_variables(
            self._target_critic_network_2, self._target_critic_network_1)

        critic_update_2 = common.soft_variables_update(
            critic_2_update_vars,
            target_critic_2_update_vars,
            tau,
            tau_non_trainable=1.0)

        actor_update_vars = common.deduped_network_variables(
            self._actor_network, self._critic_network_1, self._critic_network_2)
        target_actor_update_vars = common.deduped_network_variables(
            self._target_actor_network, self._target_critic_network_1,
            self._target_critic_network_2)

        actor_update = common.soft_variables_update(
            actor_update_vars,
            target_actor_update_vars,
            tau,
            tau_non_trainable=1.0)
        return tf.group(critic_update_1, critic_update_2, actor_update)

예제 #2

파일 보기

      def update():  # pylint: disable=missing-docstring
        critic_update_1 = common.soft_variables_update(
            self._critic_network_1.variables,
            self._target_critic_network_1.variables,
            tau,
            tau_non_trainable=1.0)

        critic_2_update_vars = common.deduped_network_variables(
            self._critic_network_2, self._critic_network_1)
        target_critic_2_update_vars = common.deduped_network_variables(
            self._target_critic_network_2, self._target_critic_network_1)

        critic_update_2 = common.soft_variables_update(
            critic_2_update_vars,
            target_critic_2_update_vars,
            tau,
            tau_non_trainable=1.0)

        actor_update_vars = common.deduped_network_variables(
            self._actor_network, self._critic_network_1, self._critic_network_2)
        target_actor_update_vars = common.deduped_network_variables(
            self._target_actor_network, self._target_critic_network_1,
            self._target_critic_network_2)

        actor_update = common.soft_variables_update(
            actor_update_vars,
            target_actor_update_vars,
            tau,
            tau_non_trainable=1.0)
        return tf.group(critic_update_1, critic_update_2, actor_update)

예제 #3

파일 보기

파일: sac_agent.py 프로젝트: zrqohbug/google-research

            def update():
                """Update target network."""
                critic_update_1 = common.soft_variables_update(
                    self._critic_network_1.variables,
                    self._target_critic_network_1.variables,
                    tau,
                    tau_non_trainable=1.0)

                critic_2_update_vars = common.deduped_network_variables(
                    self._critic_network_2, self._critic_network_1)

                target_critic_2_update_vars = common.deduped_network_variables(
                    self._target_critic_network_2,
                    self._target_critic_network_1)

                critic_update_2 = common.soft_variables_update(
                    critic_2_update_vars,
                    target_critic_2_update_vars,
                    tau,
                    tau_non_trainable=1.0)

                if self._critic_network_no_entropy_1 is None:
                    return tf.group(critic_update_1, critic_update_2)
                else:
                    critic_no_entropy_update_1 = common.soft_variables_update(
                        self._critic_network_no_entropy_1.variables,
                        self._target_critic_network_no_entropy_1.variables,
                        tau,
                        tau_non_trainable=1.0)

                    critic_no_entropy_2_update_vars = common.deduped_network_variables(
                        self._critic_network_no_entropy_2,
                        self._critic_network_no_entropy_1)

                    target_critic_no_entropy_2_update_vars = common.deduped_network_variables(
                        self._target_critic_network_no_entropy_2,
                        self._target_critic_network_no_entropy_1)

                    critic_no_entropy_update_2 = common.soft_variables_update(
                        critic_no_entropy_2_update_vars,
                        target_critic_no_entropy_2_update_vars,
                        tau,
                        tau_non_trainable=1.0)

                    return tf.group(critic_update_1, critic_update_2,
                                    critic_no_entropy_update_1,
                                    critic_no_entropy_update_2)