Python StablizerOneD示例

编程语言: Python

命名空间/包名称: Env.CustomEnv.StablizerOneD

类/类型: StablizerOneD

hotexamples.com的示例: 3

Python StablizerOneD - 已找到3个示例。这些是从开源项目中提取的最受好评的Env.CustomEnv.StablizerOneD.StablizerOneD现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

StablizerOneD(2)

render_traj(1)

reset(1)

step(1)

示例#1

显示文件

文件： testStablizerOneD.py 项目： wyardt/DeepReinforcementLearning-PyTorch

from Env.CustomEnv.StablizerOneD import StablizerOneD
import random
import matplotlib.pyplot as plt

env = StablizerOneD()
state = env.reset()
print(state)


stateSet = []
stateSet.append(state)
for i in range(1000):
    action = random.randint(0, env.nbActions - 1)
    state, reward, done, _ = env.step(action)
    #print('step ' + str(i))
    #print(state)
    #print(reward)
    #print(done)
    stateSet.append(state)
    if done:
        break


print(stateSet)
fig = plt.figure(2)
ax = plt.axes()
env.render_traj(stateSet, ax)
plt.show()

示例#2

显示文件

文件： DQN_StabilizerOneD.py 项目： wyardt/DeepReinforcementLearning-PyTorch

config['epsThreshold'] = 0.1
config['targetNetUpdateStep'] = 100
config['memoryCapacity'] = 200
config['trainBatchSize'] = 32
config['gamma'] = 0.9
config['learningRate'] = 0.001
config['netGradClip'] = 1
config['logFlag'] = True
config['logFileName'] = 'StabilizerOneDLog/traj'
config['logFrequency'] = 100
config['priorityMemoryOption'] = False
config['netUpdateOption'] = 'doubleQ'
config['netUpdateFrequency'] = 1
config['priorityMemory_absErrUpper'] = 5

env = StablizerOneD()
N_S = env.stateDim
N_A = env.nbActions

netParameter = dict()
netParameter['n_feature'] = N_S
netParameter['n_hidden'] = [100]
netParameter['n_output'] = N_A

policyNet = MultiLayerNetRegression(netParameter['n_feature'],
                                    netParameter['n_hidden'],
                                    netParameter['n_output'])

targetNet = deepcopy(policyNet)

optimizer = optim.Adam(policyNet.parameters(), lr=config['learningRate'])

示例#3

显示文件

文件： DQN_StabilizerOneDVecEnv.py 项目： wyardt/DeepReinforcementLearning-PyTorch

    def _thunk():
        env = StablizerOneD(config, i)

        return env