Python PayloadCoop.reset примеры использования

Язык программирования: Python

Пространство имен/Пакет: gym_pybullet_drones.envs.multi_agent_rl.PayloadCoop

Класс/Тип: PayloadCoop

Метод/Функция: reset

Примеров на hotexamples.com: 3

Python PayloadCoop.reset - 3 примера найдено. Это лучшие примеры Python кода для gym_pybullet_drones.envs.multi_agent_rl.PayloadCoop.PayloadCoop.reset, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

reset(3)

PayloadCoop(3)

render(2)

step(2)

TRAINING_PHASE(1)

_getDroneStateVector(1)

close(1)

getPyBulletClient(1)

set_phase(1)

Пример #1

Показать файл

    #### Create test environment ###############################
    test_env = PayloadCoop(num_drones=NUM_DRONES,
                           aggregate_phy_steps=shared_constants.AGGR_PHY_STEPS,
                           obs=OBS,
                           act=ACT,
                           gui=True,
                           record=True)
    #### Show, record a video, and log the model's performance #

    for ep in range(10):

        logger = Logger(logging_freq_hz=int(test_env.SIM_FREQ /
                                            test_env.AGGR_PHY_STEPS),
                        num_drones=NUM_DRONES)
        test_env.set_phase(12)
        obs = test_env.reset()
        action = {i: action_space.sample() for i in range(NUM_DRONES)}
        START = time.time()
        return_ = 0
        for i in range(0, int(test_env.EPISODE_LEN_SEC * test_env.SIM_FREQ),
                       test_env.AGGR_PHY_STEPS):  # Up to 6''
            #### Deploy the policies ###################################
            temp = {}
            temp[0] = policy0.compute_single_action(obs[0])
            temp[1] = policy1.compute_single_action(obs[1])
            action = {0: temp[0][0], 1: temp[1][0]}
            obs, reward, done, info = test_env.step(action)
            if i % test_env.SIM_FREQ == 0:
                test_env.render()

            if test_env.GUI:

Пример #2

Показать файл

    agent.restore(checkpoint)


    
    #### Create test environment ###############################
    test_env = PayloadCoop(num_drones=NUM_DRONES,
                            aggregate_phy_steps=shared_constants.AGGR_PHY_STEPS,
                            obs=OBS,
                            act=ACT,
                            gui=True,
                            record=True
    )
    for ep in range(10):
        #### Show, record a video, and log the model's performance #
        test_env.set_phase(12)
        obs = test_env.reset()
        logger = Logger(logging_freq_hz=int(test_env.SIM_FREQ/test_env.AGGR_PHY_STEPS),
                        num_drones=NUM_DRONES
                        )
        action = {i: action_space.sample() for i in range(NUM_DRONES)}
        start = time.time()

        policy0 = agent.get_policy("pol0")
        policy1 = agent.get_policy("pol1")

        START = time.time()
        for i in range(0, int(test_env.EPISODE_LEN_SEC * test_env.SIM_FREQ), test_env.AGGR_PHY_STEPS):
            #### Step the simulation ###################################
            temp = {}
            act0 = policy0.compute_actions(obs[0].reshape(1, -1))[0][0]
            act1 = policy1.compute_actions(obs[1].reshape(1, -1))[0][0]

Пример #3

Показать файл

                      episode_len_sec=ARGS.duration_sec)

    #### Obtain the PyBullet Client ID from the environment ####
    PYB_CLIENT = env.getPyBulletClient()

    #### Initialize the logger #################################
    logger = Logger(logging_freq_hz=int(ARGS.simulation_freq_hz /
                                        AGGR_PHY_STEPS),
                    num_drones=ARGS.num_drones)

    #### Run the simulation ####################################
    env.TRAINING_PHASE = 12
    CTRL_EVERY_N_STEPS = int(np.floor(env.SIM_FREQ / ARGS.control_freq_hz))
    action = {i: np.array([0, 0, 0, 0, 0.1]) for i in range(ARGS.num_drones)}
    START = time.time()
    obs = env.reset()
    return_ = 0
    env.reset()
    for i in range(0, int(ARGS.duration_sec * env.SIM_FREQ), AGGR_PHY_STEPS):
        obs, reward, done, info = env.step(action)
        print(obs[0].round(2))
        drone0 = env._getDroneStateVector(0)
        drone1 = env._getDroneStateVector(1)
        if i % env.SIM_FREQ == 0:  # setiap 1 detik
            # print("Jarak Drone 0 dengan drone lain: {}".format((drone1[0:3] - drone0[0:3]).round(3)))
            # print("Hasil Normalisasi:               {}".format((obs[0][5:]).round(3)))
            # print("Jarak Drone 0 dengan goal:       {}".format((env.DEST_POINT - drone0[0:3]).round(3)))
            # print("Hasil Normalisasi:               {}\n".format((obs[0][2:5]).round(3)))
            env.render()
        if ARGS.gui:
            sync(i, START, env.TIMESTEP)