Python LowestCenterOfGravityAgent 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: baseline

hotexamples.com에서의 예제들: 4

Python LowestCenterOfGravityAgent - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 baseline.LowestCenterOfGravityAgent에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

LowestCenterOfGravityAgent(1)

act(1)

예제 #1

파일 보기

파일: rl.py 프로젝트: mpaluta/Tetris-Reinforcement-Learning

 def __init__(self, teacher_iters, QM, e, epsilon):
     self.eps = epsilon
     self.placement = None
     self.penum = PlacementEnumerator(e)
     self.teacher_iters = teacher_iters
     self.teacher = LowestCenterOfGravityAgent(e)
     self.QM = QM

예제 #2

파일 보기

파일: rl.py 프로젝트: mkayser/tetris_rl

 def __init__(self, teacher_iters, QM, e, epsilon):
     self.eps = epsilon
     self.placement = None
     self.penum = PlacementEnumerator(e)
     self.teacher_iters = teacher_iters
     self.teacher = LowestCenterOfGravityAgent(e)
     self.QM = QM

예제 #3

파일 보기

파일: rl.py 프로젝트: mpaluta/Tetris-Reinforcement-Learning

class FullPlacementActor(object):
    def __init__(self, teacher_iters, QM, e, epsilon):
        self.eps = epsilon
        self.placement = None
        self.penum = PlacementEnumerator(e)
        self.teacher_iters = teacher_iters
        self.teacher = LowestCenterOfGravityAgent(e)
        self.QM = QM

    def act(self, s, debug_mode=False):
        debug_info = {}
        if s.t < self.teacher_iters:
            debug_info["pfbms"] = []
            return (self.teacher.act(s), debug_info)

        if self.placement is None or not self.placement.is_incomplete():
            choices = self.penum.get_placement_actions(s)
            debug_info["pfbms"] = map(lambda x: x.pfbm, choices)

            if random.random() < self.eps:
                p = random.choice(choices)
            else:
                pass
                #all_actions = map(lambda x: x.minor_actions,choices)
                #all_bitmaps = map(lambda x: x.final_state.arena.bitmap[-1].flatten(),choices)
                #initial_bitmaps = [s.arena.bitmap[-1].flatten() for i in all_bitmaps]
                #print "{} choices. Bitmaps/Bitmaps/Betas: {}".format(len(choices), list(zip(initial_bitmaps,all_bitmaps,map(lambda x: self.QM.beta(s,x), choices))))
                #raise Exception("TODO")

                p = max(choices, key=lambda x: self.QM.q(s, x))
            self.placement = PartiallyCompletedPlacement(p)
        else:
            debug_info["pfbms"] = []

        return (self.placement.incr_action(), debug_info)

예제 #4

파일 보기

파일: rl.py 프로젝트: mkayser/tetris_rl

class FullPlacementActor(object):
    def __init__(self, teacher_iters, QM, e, epsilon):
        self.eps = epsilon
        self.placement = None
        self.penum = PlacementEnumerator(e)
        self.teacher_iters = teacher_iters
        self.teacher = LowestCenterOfGravityAgent(e)
        self.QM = QM

    def act(self, s, debug_mode=False):
        debug_info = {}
        if s.t < self.teacher_iters:
            debug_info["pfbms"] = []
            return (self.teacher.act(s), debug_info)

        if self.placement is None or not self.placement.is_incomplete():
            choices = self.penum.get_placement_actions(s)
            debug_info["pfbms"] = map(lambda x: x.pfbm, choices)

            if random.random() < self.eps:
                p = random.choice(choices)
            else:
                pass
                # all_actions = map(lambda x: x.minor_actions,choices)
                # all_bitmaps = map(lambda x: x.final_state.arena.bitmap[-1].flatten(),choices)
                # initial_bitmaps = [s.arena.bitmap[-1].flatten() for i in all_bitmaps]
                # print "{} choices. Bitmaps/Bitmaps/Betas: {}".format(len(choices), list(zip(initial_bitmaps,all_bitmaps,map(lambda x: self.QM.beta(s,x), choices))))
                # raise Exception("TODO")

                p = max(choices, key=lambda x: self.QM.q(s, x))
            self.placement = PartiallyCompletedPlacement(p)
        else:
            debug_info["pfbms"] = []

        return (self.placement.incr_action(), debug_info)