Python MADDPG.run примеры использования

Язык программирования: Python

Пространство имен/Пакет: maddpg

Класс/Тип: MADDPG

Метод/Функция: run

Примеров на hotexamples.com: 2

Python MADDPG.run - 2 примера найдено. Это лучшие примеры Python кода для maddpg.MADDPG.run, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

MADDPG(30)

act(26)

update_targets(12)

update(9)

reset(5)

step(4)

learn(4)

save(4)

test(3)

choose_action(2)

run(2)

update_policy(2)

train(2)

store_transition(1)

take_actions(1)

select_action_test(1)

select_action(1)

save_weights(1)

save_model(1)

save_checkpoint(1)

actors_target(1)

reset_ounoise(1)

actor_optimizer(1)

load_model(1)

load_from_file(1)

load_critic(1)

load_checkpoint(1)

load_actor(1)

load(1)

init_from_save(1)

init_from_env(1)

critics_target(1)

critic_optimizer(1)

create_agents(1)

load_weights(1)

Пример #1

Показать файл

from multiagent.environment import MultiAgentEnv
import multiagent.scenarios as scenarios
import torch
import numpy as np

from agent import DDPGAgent
from maddpg import MADDPG
from utils import MultiAgentReplayBuffer


def make_env(scenario_name, benchmark=False):
    # load scenario from script
    scenario = scenarios.load(scenario_name + ".py").Scenario()
    # create world
    world = scenario.make_world()
    # create multiagent environment
    if benchmark:
        env = MultiAgentEnv(world, scenario.reset_world, scenario.reward,
                            scenario.observation, scenario.benchmark_data)
    else:
        env = MultiAgentEnv(world, scenario.reset_world, scenario.reward,
                            scenario.observation)
    return env


env = make_env(scenario_name="simple_spread")

ma_controller = MADDPG(env, 1000000)
ma_controller.run(500, 300, 32)

Пример #2

Показать файл

Файл: test.py Проект: Yoshi-0921/MADDPG-PL

        self.reset()

    def reset(self):
        self.states = self.env.reset()
        self.step = 0

    def get_actions(self, states):
        actions = []
        for i in range(self.num_agents):
            action = self.agents[i].get_action(states[i])
            actions.append(action)
        return actions

    def run(self):
        for i in range(200):
            actions = self.get_actions(self.states)
            next_states, rewards, dones, _ = self.env.step(actions)
            self.env.render()
    
            if all(dones) or self.step == 199:# cfg.max_episode_len - 1:
                self.reset()
                break
            else:
                dones = [0 for _ in range(self.num_agents)]
                self.states = next_states
                self.step += 1

if __name__ == '__main__':
    maddpg = MADDPG()
    maddpg.run()