Python DP.policy_eval 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dp

클래스/타입: DP

메소드/함수: policy_eval

hotexamples.com에서의 예제들: 1

Python DP.policy_eval - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dp.DP.policy_eval에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DP(10)

add_acl(6)

add_port(5)

add_router(3)

parser(3)

q_values(2)

add_vlan(1)

finalize_config(1)

getCompuEcssInfo(1)

policy(1)

policy_eval(1)

policy_imp(1)

policy_iter(1)

resolve_stack_topology(1)

예제 #1

파일 보기

                    env.reset()
        print(ix)
        sleep(1)
        env.close()
        return sim_store


if __name__ == "__main__":
    env = FrozenLakeEnv(is_slippery=True)

    env.num_actions = env.nA
    env.num_states = env.nS
    o = env.reset()
    dp = DP(env)
    for _ in range(100):
        dp.policy_eval()
        dp.policy_imp()
    dp.q_values = np.array([dp.q_values[s] for s in dp.q_values])
    # exit()
    # plt.figure(figsize=(8, 8), num="dp_sv")
    # sns.heatmap(dp.state_values.reshape(4, 4),
    #             cmap="Spectral", annot=True, cbar=False)
    # plt.figure(figsize=(8, 8), num="dp_q")
    # sns.heatmap(dp.q_values.reshape(16, 4),
    #             cmap="Spectral", annot=True, cbar=False)
    # plt.show()
    # plt.show()
    birl = Birl(env.num_states)
    print("Running Sim")
    birl.sim_store = birl.sim(dp)
    print("Running Sim Done")