Python GridWorldWindow 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ui

클래스/타입: GridWorldWindow

hotexamples.com에서의 예제들: 2

Python GridWorldWindow - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ui.GridWorldWindow에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

GridWorldWindow(1)

clear(1)

run(1)

show_dialog(1)

update_grid(1)

예제 #1

파일 보기

    def __init__(self,metadata):
        self.gridworldwindow = GridWorldWindow(metadata=metadata)
        self.mdp = GridMDP(metadata=metadata)

        self.gridworldwindow.btn_value_iteration_1_step.configure(command=self._value_iteration_1_step)
        self.gridworldwindow.btn_value_iteration_100_steps.configure(command=self._value_iteration_100_steps)
        self.gridworldwindow.btn_value_iteration_slow.configure(command=self._value_iteration_slow)
        self.gridworldwindow.btn_policy_iteration_1_step.configure(command=self._policy_iteration_1_step)
        self.gridworldwindow.btn_policy_iteration_100_steps.configure(command=self._policy_iteration_100_steps)
        self.gridworldwindow.btn_policy_iteration_slow.configure(command=self._policy_iteration_slow)

        self.gridworldwindow.btn_reset.configure(command=self._reset_grid)

예제 #2

파일 보기

class ViewController(object):
    def __init__(self, metadata):
        self.gridworld = GridWorldWindow(metadata=metadata)
        self.mdp = GridMDP(metadata=metadata)

        # bind buttons
        self.gridworld.btn_value_iteration_1_step.configure(
            command=self._value_iteration_1_step)
        self.gridworld.btn_value_iteration_100_steps.configure(
            command=self._value_iteration_100_steps)
        self.gridworld.btn_value_iteration_slow.configure(
            command=self._value_iteration_slow)
        self.gridworld.btn_policy_iteration_1_step.configure(
            command=self._policy_iteration_1_step)
        self.gridworld.btn_policy_iteration_100_steps.configure(
            command=self._policy_iteration_100_steps)
        self.gridworld.btn_policy_iteration_slow.configure(
            command=self._policy_iteration_slow)

        self.gridworld.btn_reset.configure(command=self._reset_grid)

    def _value_iteration_1_step(self):
        values = value_iteration(self.mdp.values, self.mdp, num_iter=1)
        policy = policy_extraction(values, self.mdp)
        self.gridworld.update_grid(values, policy)
        self.mdp.update_values(values)
        self.mdp.update_policy(policy)

    def _value_iteration_100_steps(self):
        values = value_iteration(self.mdp.values, self.mdp, num_iter=100)
        policy = policy_extraction(values, self.mdp)
        self.gridworld.update_grid(values, policy)
        self.mdp.update_values(values)
        self.mdp.update_policy(policy)

    def _value_iteration_slow(self):
        # run one iteration of value iteration at a time
        old_values = dict(self.mdp.values)
        for i in range(100):
            values = value_iteration(self.mdp.values, self.mdp, num_iter=1)
            policy = policy_extraction(values, self.mdp)
            self.gridworld.update_grid(values, policy)
            self.mdp.update_values(values)
            self.mdp.update_policy(policy)

            self.gridworld.window.update()
            time.sleep(0.25)
            self.gridworld.window.update()

            new_values = dict(values)
            if values_converged(new_values, old_values):
                break

            old_values = new_values
        self.gridworld.show_dialog(
            'Value Iteration has converged in {} steps!'.format(i + 1))

    def _policy_iteration_1_step(self):
        policy, values = policy_iteration(self.mdp.policy,
                                          self.mdp,
                                          num_iter=1)
        self.gridworld.update_grid(values, policy)
        self.mdp.update_values(values)
        self.mdp.update_policy(policy)

    def _policy_iteration_100_steps(self):
        policy_iteration(self.mdp, num_iter=100)
        self.gridworld.update_grid(self.mdp.values, self.mdp.policy)

    def _policy_iteration_slow(self):
        # run one iteration of policy iteration at a time
        old_policy = dict(self.mdp.policy)
        for i in range(100):
            policy_iteration(self.mdp, num_iter=1)
            self.gridworld.update_grid(self.mdp.values, self.mdp.policy)
            self.gridworld.window.update()
            time.sleep(0.25)
            self.gridworld.window.update()

            new_policy = dict(self.mdp.policy)
            if policy_converged(new_policy, old_policy):
                break

            old_policy = new_policy
        self.gridworld.show_dialog(
            'Policy Iteration has converged in {} steps!'.format(i + 1))

    def _reset_grid(self):
        self.mdp.clear()
        self.gridworld.clear()

    def run(self):
        # main UI loop
        self.gridworld.run()