Python ReplayBuffer.GetOccupencyの例

プログラミング言語: Python

名前空間/パッケージ名: utils.ReplayBuffer

クラス/型: ReplayBuffer

メソッド/関数: GetOccupency

hotexamples.comのコード掲載数: 2

Python ReplayBuffer.GetOccupency - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのutils.ReplayBuffer.ReplayBuffer.GetOccupencyの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

ReplayBuffer(19)

sample(13)

add(8)

push(4)

GetOccupency(2)

SampleMiniBatch(2)

StoreTransition(2)

update(2)

LoadBuffer(1)

SaveBuffer(1)

record(1)

update_priorities(1)

コード例 #1

ファイルを表示

ファイル: ddpg_mine.py プロジェクト: ataitler/DQN

##################
saver = tf.train.Saver()
init = tf.initialize_all_variables()
summary = tf.merge_all_summaries()

logger = tf.train.SummaryWriter(OUT_DIR, sess.graph)

# initialize mdp state structure
mdp = MDP_state(STATE_SIZE, FRAMES)

# initialize replay buffer
R = ReplayBuffer(MDP_STATE_SIZE, ACTION_SIZE, BUFFER_SIZE)
buf = R.LoadBuffer(OUT_DIR + BUFFER_FILE)
if buf:
    EXP_PROB = EPSILON
    populated = R.GetOccupency()
    print("Replay buffer loaded from disk, occupied: " + str(populated))
else:
    print("Creating new replay buffer")

# load saved model
ckpt = tf.train.get_checkpoint_state(OUT_DIR)
if ckpt and ckpt.model_checkpoint_path:
    saver.restore(sess, ckpt.model_checkpoint_path)
    print("Model loaded from disk")

# define action discretization
#max_a = env.action_space.high[0]
#min_a = env.action_space.low[0]

n = OUnoise(1, 0.5, 1)

コード例 #2

ファイルを表示

ファイル: DQN.py プロジェクト: ataitler/DQN

ann_fric = (1-EPSILON)/ANNEALING
EXP_PROB = 1

# initialize environment
env = gym.make(ENVIRONMENT)

# initialize mdp state structure
mdp = MDP_state(STATE_SIZE, FRAMES)

# initialize replay buffer
R = ReplayBuffer(MDP_STATE_SIZE, 1, BUFFER_SIZE)
buf = R.LoadBuffer(OUT_DIR+BUFFER_FILE)
if buf:
	EXP_PROB = EPSILON
	populated = R.GetOccupency()
	print("Replay buffer loaded from disk, occupied: " + str(populated))
else:
	print("Creating new replay buffer")

# load saved model
ckpt = tf.train.get_checkpoint_state(OUT_DIR)
if ckpt and ckpt.model_checkpoint_path:
	saver.restore(sess,ckpt.model_checkpoint_path)
	print("Model loaded from disk")

# define action discretization
max_a = env.action_space.high[0]
min_a = env.action_space.low[0]

act = actions(ACTION_SIZE, max_a)