Python environment 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: cart_pole_pixels_evaluator

메소드/함수: environment

hotexamples.com에서의 예제들: 2

Python environment - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 cart_pole_pixels_evaluator.environment에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: cart_pole_pixels_rudolf_ha_reinforce_baseline.py 프로젝트: mathemage/drl-mff-uk-2018-winter-semester

                        default=0,
                        type=int,
                        help="Render some episodes.")
    parser.add_argument("--threads",
                        default=32,
                        type=int,
                        help="Maximum number of threads to use.")

    parser.add_argument("--evaluate",
                        default=True,
                        type=bool,
                        help="Run evaluation phase.")
    args = parser.parse_args()

    # Create the environment
    env = cart_pole_pixels_evaluator.environment()

    # Construct the network
    network = Network(threads=args.threads)
    network.construct(args, env.state_shape, env.actions)

    # Load the checkpoint if required
    if args.checkpoint:
        # Try extract it from embedded_data
        try:
            import embedded_data_cart_pole_pixels_rudolf_ha_reinforce_baseline
            embedded_data_cart_pole_pixels_rudolf_ha_reinforce_baseline.extract(
            )
            # print("embedded_data extracted")
        except:
            pass

예제 #2

파일 보기

파일: reinforce_pixels.py 프로젝트: jencmart/deepLearning_lab_11

    # ##################################################################################################################

    args = parser.parse_args([] if "__file__" not in globals() else None)

    # Fix random seeds and threads
    np.random.seed(args.seed)
    tf.random.set_seed(args.seed)
    tf.config.threading.set_inter_op_parallelism_threads(args.threads)
    tf.config.threading.set_intra_op_parallelism_threads(args.threads)

    # Report only errors by default
    if not args.verbose:
        os.environ["TF_CPP_MIN_LOG_LEVEL"] = "3"

    # Create the environment
    env = cart_pole_pixels_evaluator.environment(seed=args.seed)
    possible_actions = list(range(env.actions))

    # Construct the network
    network = Network(env, args)

    # Training
    for _ in range(args.episodes // args.batch_size):
        batch_states, batch_actions, batch_returns = [], [], []

        # Batch over multiple episodes (failed / finished)
        for _ in range(args.batch_size):
            # Perform episode
            states, actions, rewards = [], [], []
            state, done = env.reset(), False
            while not done: