Python EpsilonGreedyPolicy.n示例

编程语言: Python

命名空间/包名称: policy

方法/功能: n

hotexamples.com的示例: 1

Python EpsilonGreedyPolicy.n - 已找到1个示例。这些是从开源项目中提取的最受好评的policy.EpsilonGreedyPolicy.n现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

EpsilonGreedyPolicy(10)

action_probability(1)

epsilon(1)

getActions(1)

getNextAction(1)

n(1)

take_action(1)

updateQ(1)

示例#1

显示文件

         }
     else:
         kwargs = {
             'D': D,
             'M': M,
             'learning_rate': args.alpha,
             'F': [(1, 1)],
             'c0': c0,
             'C': [(c0, )]
         }
     graph_f = cnn.build_graph
 else:
     kwargs = {'D': D, 'M': M, 'learning_rate': args.alpha}
     graph_f = ann.build_graph
 pol = EpsilonGreedyPolicy(eps=1.0, decay_f=decay_f)
 pol.n = args.eps_start
 if args.mode == 'leaf':
     sv = tdleaf.TDLeafSupervisor(pol,
                                  mv_limit=args.move_count,
                                  depth=args.depth,
                                  y=args.gamma,
                                  l=args.lambd)
 else:
     sv = tdstem.TDStemSupervisor(pol,
                                  mv_limit=args.move_count,
                                  depth=args.depth,
                                  y=args.gamma,
                                  l=args.lambd)
 sv.run(args.I,
        args.N,
        graph_f,