Python SoftmaxPolicy Examples

Programming Language: Python

Namespace/Package Name: chainerrl.policies

Method/Function: SoftmaxPolicy

Examples at hotexamples.com: 3

Python SoftmaxPolicy - 3 examples found. These are the top rated real world Python examples of chainerrl.policies.SoftmaxPolicy extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

File: TTT_GUI.py Project: ruehlef/Physics-Reports

 def __init__(self, ndim_obs, n_actions, hidden_sizes=(50, 50, 50)):
     self.pi = policies.SoftmaxPolicy(model=links.MLP(
         ndim_obs, n_actions, hidden_sizes, nonlinearity=F.tanh))
     self.v = links.MLP(ndim_obs,
                        1,
                        hidden_sizes=hidden_sizes,
                        nonlinearity=F.tanh)
     super().__init__(self.pi, self.v)

Example #2

Show file

 def __init__(self, gpu=False):
     self.q_func = policies.SoftmaxPolicy(model=QFunction())
     self.v_func = VFunction()
     self.common = SharedFunctionSFCNN()  #SharedFunctionCNN()
     if gpu:
         self.q_func.to_gpu(0)
         self.v_func.to_gpu(0)
         self.common.to_gpu(0)
     #super(A3CFFSoftmax,self).__init__(self.common,self.q_func, self.v_func)
     super().__init__(self.common, self.q_func, self.v_func)

Example #3

Show file

File: train_a2c_gym.py Project: phymucs/chainerrl

 def __init__(self, ndim_obs, n_actions, hidden_sizes=(64, 64)):
     self.pi = policies.SoftmaxPolicy(
         model=links.MLP(ndim_obs, n_actions, hidden_sizes))
     self.v = links.MLP(ndim_obs, 1, hidden_sizes=hidden_sizes)
     super().__init__(self.pi, self.v)