Python Config.optimizer_fn примеры использования

Язык программирования: Python

Пространство имен/Пакет: conformer_rl.config

Класс/Тип: Config

Метод/Функция: optimizer_fn

Примеров на hotexamples.com: 2

Python Config.optimizer_fn - 2 примера найдено. Это лучшие примеры Python кода для conformer_rl.config.Config.optimizer_fn, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

train_env(5)

eval_env(5)

tag(4)

max_steps(3)

network(3)

save_interval(3)

eval_interval(3)

eval_episodes(2)

optimizer_fn(2)

use_tensorboard(1)

use_gae(1)

rollout_length(1)

recurrence(1)

ppo_ratio_clip(1)

optimization_epochs(1)

num_workers(1)

Config(1)

mini_batch_size(1)

curriculum(1)

gradient_clip(1)

gae_lambda(1)

entropy_weight(1)

discount(1)

data_dir(1)

curriculum_agent_success_rate(1)

curriculum_agent_reward_thresh(1)

curriculum_agent_fail_rate(1)

curriculum_agent_buffer_len(1)

value_loss_weight(1)

Пример #1

Показать файл

    def __init__(self, config: Config):
        super().__init__(config)

        self.network = config.network  # neural network / model
        self.optimizer = config.optimizer_fn(self.network.parameters())

        self.total_rewards = np.zeros(config.num_workers)
        self.states = self.task.reset()
        self.prediction = None

Пример #2

Показать файл

Файл: example2.py Проект: ZimmermanGroup/conformer-rl

import logging
logging.basicConfig(level=logging.DEBUG)

if __name__ == '__main__':
    utils.set_one_thread()

    mol_config = test_alkane()

    config = Config()
    config.tag = 'example2'
    config.network = RTGN(6, 128, edge_dim=6, node_dim=5).to(device)
    # Batch Hyperparameters
    config.num_workers = 20
    config.rollout_length = 20
    config.optimization_epochs = 4
    config.max_steps = 10000000
    config.save_interval = config.num_workers*200*5
    config.eval_interval = config.num_workers*200*5
    config.eval_episodes = 2
    config.mini_batch_size = 50

    # Coefficient Hyperparameters
    lr = 5e-6 * np.sqrt(config.num_workers)
    config.optimizer_fn = lambda params: torch.optim.Adam(params, lr=lr, eps=1e-5)

    # Task Settings
    config.train_env = Task('GibbsScorePruningEnv-v0', concurrency=True, num_envs=config.num_workers, seed=np.random.randint(0,1e5), mol_config=mol_config, max_steps=200)
    config.eval_env = Task('GibbsScorePruningEnv-v0', seed=np.random.randint(0,7e4), mol_config=mol_config, max_steps=200)

    agent = PPOAgent(config)
    agent.run_steps()