Python RLGlue.num_episodes 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rl_glue

클래스/타입: RLGlue

메소드/함수: num_episodes

hotexamples.com에서의 예제들: 3

Python RLGlue.num_episodes - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rl_glue.RLGlue.num_episodes에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

RLGlue(30)

rl_agent_message(30)

rl_episode(30)

rl_init(30)

rl_start(23)

num_ep_steps(9)

rl_step(9)

num_steps(5)

rl_cleanup(5)

num_episodes(3)

rl_env_message(3)

rl_return(2)

RL_agent_message(1)

RL_cleanup(1)

change_agent(1)

total_reward(1)

예제 #1

파일 보기

from rl_glue import RLGlue
from windy_env import WindyEnvironment
from sarsa_agent import SarsaAgent
import numpy as np
import matplotlib.pyplot as plt

max_steps = 8000
steps = 0
episodes = 0

ep_list = []
step_list = []

environment = WindyEnvironment()
agent = SarsaAgent()
rl = RLGlue(environment, agent)
rl.rl_init()
while steps < max_steps:
    rl.rl_episode(max_steps)
    steps = rl.num_steps()
    episodes = rl.num_episodes()
    # print(steps, episodes)

    ep_list.append(episodes)
    step_list.append(steps)

plt.xlabel('Time steps')
plt.ylabel('Episodes')
plt.plot(step_list, ep_list)
plt.show()

예제 #2

파일 보기

import numpy as np
import matplotlib.pyplot as plt

if __name__ == "__main__":
    max_steps = 8000
    num_runs = 1

    # Create and pass agent and environment objects to RLGlue
    environment = WindygridEnvironment()
    agent = SarsaAgent()
    rlglue = RLGlue(environment, agent)
    del agent, environment  # don't use these anymore
    for run in range(num_runs):
        episode=[]
        time_step=[]
        rlglue.rl_init()
        while True:
            rlglue.rl_episode()
            time_step.append(rlglue.num_steps())
            episode.append(rlglue.num_episodes())
            if rlglue.num_steps() > 8000:
                break

    plt.plot(time_step,episode,label="8 actions")
    plt.xticks([0, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000])
    plt.xlabel('Time steps')
    plt.ylabel('Episode', rotation=90)
    plt.legend(loc=2)
    plt.show()
        # save average value function numpy object, to be used by plotting script

예제 #3

파일 보기

from rl_glue import RLGlue
from windy_env import WindyEnvironment
from n_step_sarsa_agent import SarsaAgent
import numpy as np
import time
import matplotlib.pyplot as plt

if __name__ == "__main__":
    start_time = time.time()
    max_steps = 8000

    # Create and pass agent and environment objects to RLGlue
    environment = WindyEnvironment()
    agent = SarsaAgent()
    rlglue = RLGlue(environment, agent)
    del agent, environment  # don't use these anymore
    rlglue.rl_init()
    L1 = []
    L2 = []
    n = rlglue.rl_agent_message('n')
    a = rlglue.rl_agent_message('a')
    while rlglue.num_steps() < max_steps:
        L1.append(rlglue.num_steps())
        rlglue.rl_episode(10000)
        episodes = rlglue.num_episodes()
        L2.append(episodes)
    plt.title(str(n) + '-step sarsa with ' + str(a) + " actions")
    plt.plot(L1, L2)
    plt.show()