Python TD0の例

プログラミング言語: Python

名前空間/パッケージ名: algorithms.rl_func_approx.td0

メソッド/関数: TD0

hotexamples.comのコード掲載数: 3

Python TD0 - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのalgorithms.rl_func_approx.td0.TD0の実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: run_all_algorithms.py プロジェクト: gravityrahul/MDP-DP-RL

 def get_fa_qlearning(self) -> td0_fa.TD0:
     return td0_fa.TD0(
         self.get_mdp_rep_for_rl_fa(),
         TDAlgorithm.QLearning,
         self.softmax,
         self.epsilon,
         self.epsilon_half_life,
         self.learning_rate,
         self.num_episodes,
         self.max_steps,
         self.fa_spec
     )

コード例 #2

ファイルを表示

ファイル: run_all_algorithms.py プロジェクト: gravityrahul/MDP-DP-RL

 def get_fa_expected_sarsa(self) -> td0_fa.TD0:
     return td0_fa.TD0(
         self.get_mdp_rep_for_rl_fa(),
         TDAlgorithm.ExpectedSARSA,
         self.softmax,
         self.epsilon,
         self.epsilon_half_life,
         self.learning_rate,
         self.num_episodes,
         self.max_steps,
         self.fa_spec
     )

コード例 #3

ファイルを表示

 def get_fa_sarsa(self) -> td0_fa.TD0:
     return td0_fa.TD0(
         self.get_mdp_rep_for_rl_fa(),
         self.exploring_start,
         TDAlgorithm.SARSA,
         self.softmax,
         self.epsilon,
         self.epsilon_half_life,
         self.num_episodes,
         self.max_steps,
         self.fa_spec
     )