Ejemplos de SoftUpdate.make_optimizer_scheduler en Python

Lenguaje de programación: Python

Namespace/Package Name: reagent.optimizer

Clase / Tipo: SoftUpdate

Método / Función: make_optimizer_scheduler

Ejemplos en hotexamples.com: 4

Python SoftUpdate.make_optimizer_scheduler - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de reagent.optimizer.SoftUpdate.make_optimizer_scheduler extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

SoftUpdate(5)

make_optimizer_scheduler(4)

Ejemplo n.º 1

Mostrar archivo

Archivo: dqn_trainer.py Proyecto: pingponglabs/ReAgent

    def configure_optimizers(self):
        optimizers = []
        optimizers.append(
            self.q_network_optimizer.make_optimizer_scheduler(
                self.q_network.parameters()))
        if self.calc_cpe_in_training:
            optimizers.append(
                self.reward_network_optimizer.make_optimizer_scheduler(
                    self.reward_network.parameters()))
            optimizers.append(
                self.q_network_cpe_optimizer.make_optimizer_scheduler(
                    self.q_network_cpe.parameters()))

        # soft-update
        target_params = list(self.q_network_target.parameters())
        source_params = list(self.q_network.parameters())
        if self.calc_cpe_in_training:
            target_params += list(self.q_network_cpe_target.parameters())
            source_params += list(self.q_network_cpe.parameters())
        optimizers.append(
            SoftUpdate.make_optimizer_scheduler(target_params,
                                                source_params,
                                                tau=self.tau))

        return optimizers

Ejemplo n.º 2

Mostrar archivo

Archivo: qrdqn_trainer.py Proyecto: vishalbelsare/Horizon

    def configure_optimizers(self):
        optimizers = []
        target_params = list(self.q_network_target.parameters())
        source_params = list(self.q_network.parameters())

        optimizers.append(
            self.q_network_optimizer.make_optimizer_scheduler(
                self.q_network.parameters()))

        if self.calc_cpe_in_training:
            (
                cpe_target_params,
                cpe_source_params,
                cpe_optimizers,
            ) = self._configure_cpe_optimizers()
            target_params += cpe_target_params
            source_params += cpe_source_params
            optimizers += cpe_optimizers

        optimizers.append(
            SoftUpdate.make_optimizer_scheduler(target_params,
                                                source_params,
                                                tau=self.tau))

        return optimizers

Ejemplo n.º 3

Mostrar archivo

Archivo: td3_trainer.py Proyecto: pingponglabs/ReAgent

    def configure_optimizers(self):
        optimizers = []

        optimizers.append(
            self.q_network_optimizer.make_optimizer_scheduler(
                self.q1_network.parameters()))
        if self.q2_network:
            optimizers.append(
                self.q_network_optimizer.make_optimizer_scheduler(
                    self.q2_network.parameters()))
        optimizers.append(
            self.actor_network_optimizer.make_optimizer_scheduler(
                self.actor_network.parameters()))

        # soft-update
        target_params = list(self.q1_network_target.parameters())
        source_params = list(self.q1_network.parameters())
        if self.q2_network:
            target_params += list(self.q2_network_target.parameters())
            source_params += list(self.q2_network.parameters())
        target_params += list(self.actor_network_target.parameters())
        source_params += list(self.actor_network.parameters())
        optimizers.append(
            SoftUpdate.make_optimizer_scheduler(target_params,
                                                source_params,
                                                tau=self.tau))

        return optimizers

Ejemplo n.º 4

Mostrar archivo

    def configure_optimizers(self):
        optimizers = []

        optimizers.append(
            self.q_network_optimizer.make_optimizer_scheduler(
                self.q1_network.parameters()
            )
        )
        if self.q2_network:
            optimizers.append(
                self.q_network_optimizer.make_optimizer_scheduler(
                    self.q2_network.parameters()
                )
            )
        optimizers.append(
            self.actor_network_optimizer.make_optimizer_scheduler(
                self.actor_network.parameters()
            )
        )
        if self.alpha_optimizer is not None:
            optimizers.append(
                self.alpha_optimizer.make_optimizer_scheduler([self.log_alpha])
            )
        if self.value_network:
            optimizers.append(
                self.value_network_optimizer.make_optimizer_scheduler(
                    self.value_network.parameters()
                )
            )
        # soft-update
        if self.value_network:
            target_params = self.value_network_target.parameters()
            source_params = self.value_network.parameters()
        else:
            target_params = list(self.q1_network_target.parameters())
            source_params = list(self.q1_network.parameters())
            if self.q2_network:
                target_params += list(self.q2_network_target.parameters())
                source_params += list(self.q2_network.parameters())
        optimizers.append(
            SoftUpdate.make_optimizer_scheduler(
                target_params, source_params, tau=self.tau
            )
        )

        return optimizers