Python policy_extraction 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mdp

메소드/함수: policy_extraction

hotexamples.com에서의 예제들: 3

Python policy_extraction - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mdp.policy_extraction에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

    def _value_iteration_slow(self):
        old_values = dict(self.mdp.values)
        for i in range(100):
            values = value_iteration(self.mdp.values, self.mdp, num_iter=1)
            policy = policy_extraction(values, self.mdp)
            self.gridworldwindow.update_grid(values, policy)
            self.mdp.update_values(values)
            self.mdp.update_policies(policy)

            self.gridworldwindow.window.update()
            time.sleep(0.25)
            self.gridworldwindow.window.update()

            new_values = dict(values)
            if values_converged(new_values, old_values):
                break

            old_values = new_values
        self.gridworldwindow.show_dialog('Value Iteration has converged in {} steps!'.format(i+1))

예제 #2

파일 보기

 def _value_iteration_100_steps(self):
     values = value_iteration(self.mdp.values, self.mdp, num_iter=100)
     policy = policy_extraction(values, self.mdp)
     self.gridworld.update_grid(values, policy)
     self.mdp.update_values(values)
     self.mdp.update_policy(policy)

예제 #3

파일 보기

 def _value_iteration_1_step(self):
     values = value_iteration(self.mdp.values, self.mdp, num_iter=1)
     policy = policy_extraction(values, self.mdp)
     self.gridworldwindow.update_grid(values, policy)
     self.mdp.update_values(values)
     self.mdp.update_policies(policy)