Python EpochLogger 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: spinupUtils.logx

클래스/타입: EpochLogger

hotexamples.com에서의 예제들: 2

Python EpochLogger - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 spinupUtils.logx.EpochLogger에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

log_tabular(3)

EpochLogger(1)

dump_tabular(1)

store(1)

예제 #1

파일 보기

        raise ValueError(f"Invalid Policy: {args.policy}!")

    if args.save_model and not os.path.exists("./models"):
        os.makedirs("./models")

    if args.load_model != "":
        policy_file = file_name if args.load_model == "default" else args.load_model
        if not os.path.exists(f"./models/{policy_file}"):
            assert f"The loading model path of `../models/{policy_file}` does not exist! "
        policy.load(f"./models/{policy_file}")

    # Setup loggers
    logger_kwargs = setup_logger_kwargs(args.exp_name,
                                        args.seed,
                                        datestamp=False)
    logger = EpochLogger(**logger_kwargs)

    # Sync params across processes
    sync_params(policy)

    # Set up experience buffer
    local_steps_per_epoch = int(args.steps_per_epoch / num_procs())
    _replay_buffer = replay_buffer.VPGBuffer(state_dim, action_dim,
                                             local_steps_per_epoch,
                                             args.discount, args.lam,
                                             is_discrete)

    state, done = env.reset(), False
    episode_reward = 0
    episode_timesteps = 0
    episode_num = 0

예제 #2

파일 보기

파일: main.py 프로젝트: LQNew/LWDRLD

        raise ValueError(f"Invalid Policy: {args.policy}!")

    if args.save_model and not os.path.exists("./models"):
        os.makedirs("./models")

    if args.load_model != "":
        policy_file = file_name if args.load_model == "default" else args.load_model
        if not os.path.exists(f"./models/{policy_file}"):
            assert f"The loading model path of `../models/{policy_file}` does not exist! "
        policy.load(f"./models/{policy_file}")

    # Setup loggers
    logger_kwargs = setup_logger_kwargs(args.exp_name,
                                        args.seed,
                                        datestamp=False)
    logger = EpochLogger(**logger_kwargs)

    _replay_buffer = replay_buffer.ReplayBuffer(int(args.buffer_size))

    print("Collecting experience...")
    epinfobuf = deque(maxlen=100)  # episode step for accumulate reward
    start_time = time.time()  # check learning time

    states = np.array(
        env.reset())  # env reset, output array of num of `#num_envs` states

    step = 0
    for t in range(1, int(args.max_timesteps) // int(args.num_envs) + 1):
        actions = policy.select_action(states, eps_schedule.value)
        next_states, rewards, dones, infos = env.step(
            actions)  # take actions and get next states