Python show_q_value 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: frozen_lake_util

메소드/함수: show_q_value

hotexamples.com에서의 예제들: 11

Python show_q_value - 11개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 frozen_lake_util.show_q_value에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: sarsa.py 프로젝트: masa-aa/Reinforcement-Learning-with-Python

def train(env=None):
    agent = SARSAAgent()
    if env is None:
        env = gym.make("FrozenLakeEasy-v0")
    agent.learn(env, episode_count=500)
    show_q_value(agent.Q)
    agent.show_reward_log()

예제 #2

파일 보기

파일: monte_carlo.py 프로젝트: masa-aa/Reinforcement-Learning-with-Python

def train(env=None):
    agent = MonteCarloAgent(epsilon=0.1)
    if env is None:
        env = gym.make("FrozenLakeEasy-v0")
    agent.learn(env, episode_count=500)
    show_q_value(agent.Q)
    agent.show_reward_log()

예제 #3

파일 보기

def train(env=None):
    trainer = ActorCritic(Actor, Critic)
    if env is None:
        env = gym.make("FrozenLakeEasy-v0")
    actor, _ = trainer.train(env, episode_count=3000)
    print(actor.Q)
    show_q_value(actor.Q)
    actor.show_reward_log()

예제 #4

파일 보기

파일: q_learning.py 프로젝트: sinonome/baby-steps-of-rl-ja

def train():
    agent = QLearningAgent()
    env = gym.make("FrozenLakeEasy-v0")
    # env.render()
    agent.learn(env,
                episode_count=300000,
                render=False,
                gamma=gamma,
                report_interval=100000)
    show_q_value(agent.Q)
    agent.show_reward_log()

예제 #5

파일 보기

파일: q_learning.py 프로젝트: sinonome/baby-steps-of-rl-ja

def train_gamma(env, name, gamma):
    agent = QLearningAgent()
    # env.render()
    agent.learn(env,
                episode_count=300000,
                render=False,
                gamma=gamma,
                report_interval=100000)
    show_q_value(agent.Q, name=name + "_stage.png")
    agent.show_reward_log(name=name + "_figure.png")
    print("game start")
    print("gamma={0} : {1}".format(
        gamma, "goal" if play(agent, env) else "game over"))

예제 #6

파일 보기

파일: q_learning.py 프로젝트: sinonome/baby-steps-of-rl-ja

def train_stg(count=10, name=None):
    for i in range(10):
        print("now: {}th".format(i))
        agent = QLearningAgent()
        env = gym.make("FrozenLakeEasy-v0")
        env.render()
        agent.learn(env,
                    episode_count=500000,
                    render=False,
                    report_interval=100000)
        show_q_value(agent.Q, name=name + "_{}_stage.png".format(i))
        agent.show_reward_log(name=name + "_{}_figure.png".format(i))
        print("game start")
        print("{0}th: {1}".format(i + 1,
                                  "goal" if play(agent, env) else "game over"))

예제 #7

파일 보기

def train():
    agent = QLearningAgent()
    env = gym.make("FrozenLakeEasy-v0")
    agent.learn(env, episode_count=500)
    show_q_value(agent.Q)
    agent.show_reward_log()

예제 #8

파일 보기

파일: compare_q_s.py 프로젝트: kumitatepazuru/ai_program_sample

                    gain = reward + gamma * self.Q[n_state][n_action]

                estimated = self.Q[s][a]
                self.Q[s][a] += learning_rate * (gain - estimated)
                s = n_state

                if self.q_learning:
                    a = self.policy(s, actions)
                else:
                    a = n_action
            else:
                self.log(reward)

            if e != 0 and e % report_interval == 0:
                pass
            #     self.show_reward_log(episode=e)


def train(q_learning):
    env = gym.make("FrozenLakeEasy-v0")
    agent = CompareAgent(q_learning=q_learning)
    agent.learn(env, episode_count=100000)
    return dict(agent.Q)


if __name__ == "__main__":
    with Pool() as pool:
        results = pool.map(train, ([True, False]))
        for r in results:
            show_q_value(r)

예제 #9

파일 보기

def train():
    trainer = ActorCritic(Actor, Critc)
    env = gym.make("FrozenLakeEasy-v0")
    actor, critic = trainer.train(env, episode_count=3000)
    show_q_value(actor.Q)
    actor.show_reward_log()

예제 #10

파일 보기

파일: sarsa.py 프로젝트: kumitatepazuru/ai_program_sample

def train():
    agent = SARSAAgent()
    env = gym.make("FrozenLakeEasy-v0")
    agent.learn(env)
    show_q_value(agent.Q)
    agent.show_reward_log()

예제 #11

파일 보기

파일: monte_carlo.py 프로젝트: kumitatepazuru/ai_program_sample

def train():
    agent = MonteCarloAgent(epsilon=0.1)
    env = gym.make("FrozenLakeEasy-v0")
    agent.learn(env)
    show_q_value(agent.Q)
    agent.show_reward_log()