Python MDP.load_from_file 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mdp

클래스/타입: MDP

메소드/함수: load_from_file

hotexamples.com에서의 예제들: 2

Python MDP.load_from_file - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mdp.MDP.load_from_file에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MDP(30)

__init__(4)

P(3)

R(3)

T_step_value_iteration(3)

available(2)

load_from_file(2)

A(1)

E_step_value_iteration(1)

Q_learning(1)

Solve(1)

VisualizeMap(1)

VisualizePolicyMap(1)

action(1)

save_to_file(1)

예제 #1

파일 보기

파일: main.py 프로젝트: mqtlam/osu-cs533

    print "=== {} ===".format(name)
    print "value function:"
    print_parking_value_function(V, mdp)
    print
    print "policy:"
    print_parking_policy(policy, mdp)
    print
    print "============================================================"
    print
    print

### PROBLEM 2
mdp = MDP()

# load MDP1
mdp.load_from_file('MDP1.txt')

epsilon = 0.000001

# run infinite horizon value iteration and policy iteration
beta = 0.1
(V, policy) = InfiniteHorizonPolicyOptimization.value_iteration(mdp, beta, epsilon)
print_helper(V, policy, "MDP1 value iteration, beta={}, epsilon={}".format(beta, epsilon))
(V, policy) = InfiniteHorizonPolicyOptimization.policy_iteration(mdp, beta)
print_helper(V, policy, "MDP1 policy iteration, beta={}".format(beta))

# run infinite horizon value iteration and policy iteration
beta = 0.9
(V, policy) = InfiniteHorizonPolicyOptimization.value_iteration(mdp, beta, epsilon)
print_helper(V, policy, "MDP1 value iteration, beta={}, epsilon={}".format(beta, epsilon))
(V, policy) = InfiniteHorizonPolicyOptimization.policy_iteration(mdp, beta)

예제 #2

파일 보기

파일: main.py 프로젝트: mqtlam/osu-cs533

    print "=== {} ===".format(name)
    print "non-stationary value function:"
    print_value_function(V)
    print
    print "policy:"
    print_policy(policy)
    print
    print "============================================================"
    print
    print

# PROBLEM 1

# load MDP debug
mdp = MDP()
mdp.load_from_file('MDP_debug.txt')

# run finite horizon value iteration
H = 10
(V, policy) = MDPOptimization.finite_horizon_value_iteration(mdp, H)
print_helper(V, policy, "MDP Debug")

# PROBLEM 2

# load custom MDP
mdp = MDP()
mdp.load_from_file('MDP_custom.txt')

# run finite horizon value iteration
H = 10
(V, policy) = MDPOptimization.finite_horizon_value_iteration(mdp, H)