Python make_env 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: common.multiprocessing_env

메소드/함수: make_env

hotexamples.com에서의 예제들: 2

Python make_env - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 common.multiprocessing_env.make_env에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

            break
    env_t.close()


env_name = 'CartPole-v1'
gamma = 0.99
num_envs = 8
PENALTY = -1.0
n_step = 4
max_frame = 50000
lr = 0.001
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

if __name__ == '__main__':

    envs = SubprocVecEnv([make_env(env_name) for i in range(num_envs)])
    net = nn.Sequential(nn.Linear(4, 128), nn.ReLU(), nn.Linear(128, 2))
    actor = Actor(4, 128, 2).to(device)
    critic = Critic(4, 128).to(device)
    solver = optim.Adam(
        list(actor.parameters()) + list(critic.parameters()), lr)

    duration = []
    frame_count = 0
    lifespan = [[0] for _ in range(num_envs)]
    s_gotten = None

    while frame_count * n_step < max_frame:
        obs_l, acts_l, rews_l, dones_l, probs_l = [], [], [], [], []
        accept_sample = [True for _ in range(num_envs)]
        for _ in range(n_step):

예제 #2

파일 보기

from common.multiprocessing_env import SubprocVecEnv, make_env
from ddpg import *
from utils import *
from memory import Memory
from ddpg_pendulum_net import Actor, Critic
import warnings

warnings.filterwarnings("ignore", category=UserWarning)

if __name__ == "__main__":

    env_name = 'Pendulum-v0'
    num_envs = 8
    envs = [make_env(env_name) for i in range(num_envs)]
    envs = SubprocVecEnv(envs)

    actor_lr = 2e-4
    critic_lr = 3e-4
    gamma = 0.99
    soft_tau = 0.001
    model = DDPG(Actor(), Critic(), gamma, soft_tau, actor_lr, critic_lr)

    memory_size = 500000
    memory = Memory(memory_size)
    eval_freq = 1000
    batch_size = 256
    n_steps = 1
    num_ddpg_iter = 5
    max_iteration = 50000

    frame_count = 0