Python TDLambda示例

编程语言: Python

命名空间/包名称: algorithms.rl_func_approx.tdlambda

方法/功能: TDLambda

hotexamples.com的示例: 2

Python TDLambda - 已找到2个示例。这些是从开源项目中提取的最受好评的algorithms.rl_func_approx.tdlambda.TDLambda现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： run_all_algorithms.py 项目： gravityrahul/MDP-DP-RL

 def get_fa_expected_sarsa_lambda(self) -> tdl_fa.TDLambda:
     return tdl_fa.TDLambda(
         self.get_mdp_rep_for_rl_fa(),
         TDAlgorithm.ExpectedSARSA,
         self.softmax,
         self.epsilon,
         self.epsilon_half_life,
         self.learning_rate,
         self.lambd,
         self.num_episodes,
         self.max_steps,
         self.fa_spec,
         self.tdl_fa_offline
     )

示例#2

显示文件

 def get_fa_qlearning_lambda(self) -> tdl_fa.TDLambda:
     return tdl_fa.TDLambda(
         self.get_mdp_rep_for_rl_fa(),
         self.exploring_start,
         TDAlgorithm.QLearning,
         self.softmax,
         self.epsilon,
         self.epsilon_half_life,
         self.lambd,
         self.num_episodes,
         self.batch_size,
         self.max_steps,
         self.fa_spec,
         self.tdl_fa_offline
     )