Python DQN.Agent 예제들

프로그래밍 언어: Python

클래스/타입: DQN

메소드/함수: Agent

hotexamples.com에서의 예제들: 6

Python DQN.Agent - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 DQN.Agent 패키지로부터 acme에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DQN(30)

Agent(6)

DQNAgent(4)

DQN_Agent(2)

Mynet(2)

Memory(2)

ImageProcess(2)

ZeroGamaDQN(2)

DQNPlayer(2)

DQNT(1)

Choose_Action_EpsilonGreedy(1)

Transition(1)

Train(1)

ReplyMemory(1)

Q_Learning(1)

QNetwork(1)

Pw_Agent(1)

NoisyDQN(1)

DQNMethod(1)

DQN_VR(1)

IRL_helper(1)

GraphNet(1)

Cartpole(1)

Deep_Q_Learning(1)

DeepQNetwork(1)

DQNplayer(1)

DQNmodel(1)

Environment(1)

예제 #1

파일 보기

def main(weights_name, video_name=None, get_image=False):
    env = DQN.Environment(render=True, sigma=0.02, down=1.0, get_image=get_image)
    s_size = env.env.s_size

    agent = DQN.Agent(s_size=s_size)
    agent.network.model.load_weights("data/" + weights_name + ".h5", by_name=True)
    print("model loaded")

    for _ in range(3):
        s = time.time()

        if video_name:
            env.record("data/mov/" + video_name + ".mp4")

        step = env.replay(agent.policy)
        print("unicycle lasted {} steps and {:2f} seconds.".format(step, step/30))
        print("time = {}".format(time.time() - s))
    env.close()

예제 #2

파일 보기

파일: play.py 프로젝트: afreeman100/TetrisDQN

def run():
    training_intervals = 100
    interval_interactions = 100
    training_steps = training_intervals * interval_interactions

    game_settings = GameSettings()

    title = 'Convolutional DDQN + PER'
    print(title)
    plt.title(title)

    agent = DQN.Agent(game_settings, training_steps)
    interactions, scores, devs = agent.learning_curve(training_intervals,
                                                      interval_interactions)
    plt.plot(interactions, smooth(scores), label='Conv. DDQN+PER')

    # plt.fill_between(interactions, scores - devs, scores + devs, alpha=0.3)
    plt.xlabel('Interactions')
    plt.ylabel('Score')
    plt.legend()
    plt.show()

예제 #3

파일 보기

파일: main.py 프로젝트: Niyu-Jia/Reports

Return_test = Return[cutpoint:]
Price_test = Price[cutpoint:]

state_size = 7
lag = int((state_size - 3) / 2)
#ticker1=np.random.choice(return1.columns)
#ticker2=np.random.choice(return2.columns)

ticker1 = 'AEP'
ticker2 = 'AAPL'

environment = env.env(act, state_size, ticker1, ticker2, Return_train,
                      Price_train, 100)

optimizer = Adam(learning_rate=0.05)
agent = DQN.Agent(environment, optimizer)

##############################################################################
"""
Training model
"""
keras.backend.clear_session()
batch_size = 8
num_of_episodes = 10
timesteps_per_episode = len(Return_train)
agent.q_network.summary()
print(
    "#######################################################################")
print("Constructing portfolio with", ticker1, 'and', ticker2)
#clear expirience storage
agent.store_clear()

예제 #4

파일 보기

파일: main.py 프로젝트: saijuttu/SuperSANN

import tensorflow as tf
import gym
import numpy as np
import random
import matplotlib.pyplot as plt
import DQN

env = gym.make('MountainCar-v0')
env.reset()
env._max_episodes = 3000

model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(24, input_shape=(4, ), activation='relu'))
model.add(tf.keras.layers.Dense(2, activation='linear'))
model.compile(loss='mse', optimizer=tf.keras.optimizers.Adam(lr=.001))

model = tf.keras.models.load_model("traditional.hd5")

episode = []
memory = []

agent = DQN.Agent(.95, .5, .999, model, env)
print(env.observation_space.shape[0])
agent.train(100, 10, 64)
agent.playGame()

model.save("model.hd5")

env.close()

예제 #5

파일 보기

    def __init__(self):

        self.agent = DQN.Agent(num_states=24, num_actions=9, memory_cap=1000)
        self.num_states = 24
        self.num_actions = 9

예제 #6

파일 보기

    def reset(self):

        self.agent = DQN.Agent(num_states=self.num_states, num_actions=self.num_actions, memory_cap=1000)
        print("Load parameters...")
        self.agent.brain.load_model('./test_weight.hdf5')