Python AWRAgent 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: learning.awr_agent

메소드/함수: AWRAgent

hotexamples.com에서의 예제들: 3

Python AWRAgent - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 learning.awr_agent.AWRAgent에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def build_agent(env, env_id, agent_configs):
    agent_configs = {}
    if (env_id in AWR_CONFIGS):
        agent_configs.update(AWR_CONFIGS[env_id])

    graph = tf.Graph()
    sess = tf.Session(graph=graph)
    agent = awr_agent.AWRAgent(env=env, sess=sess, **agent_configs)

    return agent

예제 #2

파일 보기

파일: run.py 프로젝트: tekotan/crawler

def build_agent(env):
    env_id = arg_parser.env
    agent_configs = {}
    if (env_id in awr_configs.AWR_CONFIGS):
        agent_configs = awr_configs.AWR_CONFIGS[env_id]

    graph = tf.Graph()
    sess = tf.Session(graph=graph)
    agent = awr_agent.AWRAgent(env=env, sess=sess, **agent_configs)

    return agent

예제 #3

파일 보기

파일: test_fqe.py 프로젝트: JKinx/awr

                .format(data_std, data_std), "rb")), args.constraint)

    terminals = []
    for el in datas:
        terminal = np.ones(len(el[0]))
        terminal[-1] = 0
        terminals.append(terminal)

    datas2 = []
    for el, terminal in zip(datas, terminals):
        datas2.append((el[0], el[1], el[2], terminal))

    env = gym.make("Reacher-v2")
    graph = tf.Graph()
    sess = tf.Session(graph=graph)
    agent = awr_agent.AWRAgent(env=env, sess=sess, **configs)
    agent.load_model(
        "../output/Reacher-v2_{}_offline/model.ckpt".format(data_std))

    qnn = Q(agent.get_state_size(), agent.get_action_size(), 0.001).cuda()

    eval_std = args.eval_std  # For each, try different eval_std
    num_epochs = args.n_epochs
    FQE = FittedQEvaluation(qnn)
    policy = Policy(agent, eval_std)

    FQE.fit_Q(policy, datas2, num_epochs, agent._discount)

    vals0 = []
    for _ in tqdm(range(100)):
        path = rollout_path(agent, eval_std)