Python PlacementEnumerator 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: placement

클래스/타입: PlacementEnumerator

hotexamples.com에서의 예제들: 9

Python PlacementEnumerator - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 placement.PlacementEnumerator에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

PlacementEnumerator(2)

_get_actionseq_finalstate_pairs(1)

get_placement_actions(1)

get_successor_bitmaps(1)

예제 #1

파일 보기

파일: rl.py 프로젝트: mpaluta/Tetris-Reinforcement-Learning

 def __init__(self, teacher_iters, QM, e, epsilon):
     self.eps = epsilon
     self.placement = None
     self.penum = PlacementEnumerator(e)
     self.teacher_iters = teacher_iters
     self.teacher = LowestCenterOfGravityAgent(e)
     self.QM = QM

예제 #2

파일 보기

파일: rl.py 프로젝트: mpaluta/Tetris-Reinforcement-Learning

class FullPlacementActor(object):
    def __init__(self, teacher_iters, QM, e, epsilon):
        self.eps = epsilon
        self.placement = None
        self.penum = PlacementEnumerator(e)
        self.teacher_iters = teacher_iters
        self.teacher = LowestCenterOfGravityAgent(e)
        self.QM = QM

    def act(self, s, debug_mode=False):
        debug_info = {}
        if s.t < self.teacher_iters:
            debug_info["pfbms"] = []
            return (self.teacher.act(s), debug_info)

        if self.placement is None or not self.placement.is_incomplete():
            choices = self.penum.get_placement_actions(s)
            debug_info["pfbms"] = map(lambda x: x.pfbm, choices)

            if random.random() < self.eps:
                p = random.choice(choices)
            else:
                pass
                #all_actions = map(lambda x: x.minor_actions,choices)
                #all_bitmaps = map(lambda x: x.final_state.arena.bitmap[-1].flatten(),choices)
                #initial_bitmaps = [s.arena.bitmap[-1].flatten() for i in all_bitmaps]
                #print "{} choices. Bitmaps/Bitmaps/Betas: {}".format(len(choices), list(zip(initial_bitmaps,all_bitmaps,map(lambda x: self.QM.beta(s,x), choices))))
                #raise Exception("TODO")

                p = max(choices, key=lambda x: self.QM.q(s, x))
            self.placement = PartiallyCompletedPlacement(p)
        else:
            debug_info["pfbms"] = []

        return (self.placement.incr_action(), debug_info)

예제 #3

파일 보기

파일: baseline.py 프로젝트: mpaluta/Tetris-Reinforcement-Learning

class LowestCenterOfGravityAgent(object):
    penum = None
    queued_actions = None
    e = None

    def __init__(self, e):
        self.penum = PlacementEnumerator(e)
        self.queued_actions = []

    def act(self, s, debug_mode=False):
        def score(b):
            row_indices = np.nonzero(b)[0]
            return -row_indices.mean()

        if len(self.queued_actions) > 0:
            a = self.queued_actions[0]
            self.queued_actions = self.queued_actions[1:]
            return (a, None)
        else:
            logging.info("DELTA: 0")
            a_s_p = self.penum._get_actionseq_finalstate_pairs(s)
            assert (len(a_s_p) > 0)
            amin, smin, pmin = min(a_s_p, key=lambda x: score(x[2]))
            #assert pmin.sum()==0 or np.nonzero(pmin)[0].min() == pmin.shape[0]-1

            self.queued_actions = amin[1:]
            return (amin[0], None)

    def observe_sars_tuple(self, s, a, r, sprime, pfbm=None):
        logging.info("REWARD: {}".format(r))
        pass

    def save_model(self, fn):
        pass

예제 #4

파일 보기

파일: baseline.py 프로젝트: mkayser/tetris_rl

class LowestCenterOfGravityAgent(object):
    penum=None
    queued_actions=None
    e=None
    def __init__(self,e):
        self.penum=PlacementEnumerator(e)
        self.queued_actions=[]

    def act(self,s,debug_mode=False):
        def score(b):
            row_indices = np.nonzero(b)[0]
            return -row_indices.mean()

        if len(self.queued_actions)>0:
            a = self.queued_actions[0]
            self.queued_actions = self.queued_actions[1:]
            return (a,None)
        else:
            logging.info("DELTA: 0")
            a_s_p = self.penum._get_actionseq_finalstate_pairs(s)
            assert(len(a_s_p)>0)
            amin,smin,pmin = min(a_s_p, key=lambda x:score(x[2]))
            #assert pmin.sum()==0 or np.nonzero(pmin)[0].min() == pmin.shape[0]-1

            self.queued_actions = amin[1:]
            return (amin[0], None)
                        
    def observe_sars_tuple(self,s,a,r,sprime,pfbm=None):
        logging.info("REWARD: {}".format(r))
        pass
        
    def save_model(self,fn):
        pass

예제 #5

파일 보기

파일: rl.py 프로젝트: mkayser/tetris_rl

 def __init__(self, teacher_iters, QM, e, epsilon):
     self.eps = epsilon
     self.placement = None
     self.penum = PlacementEnumerator(e)
     self.teacher_iters = teacher_iters
     self.teacher = LowestCenterOfGravityAgent(e)
     self.QM = QM

예제 #6

파일 보기

파일: rl.py 프로젝트: mkayser/tetris_rl

class FullPlacementActor(object):
    def __init__(self, teacher_iters, QM, e, epsilon):
        self.eps = epsilon
        self.placement = None
        self.penum = PlacementEnumerator(e)
        self.teacher_iters = teacher_iters
        self.teacher = LowestCenterOfGravityAgent(e)
        self.QM = QM

    def act(self, s, debug_mode=False):
        debug_info = {}
        if s.t < self.teacher_iters:
            debug_info["pfbms"] = []
            return (self.teacher.act(s), debug_info)

        if self.placement is None or not self.placement.is_incomplete():
            choices = self.penum.get_placement_actions(s)
            debug_info["pfbms"] = map(lambda x: x.pfbm, choices)

            if random.random() < self.eps:
                p = random.choice(choices)
            else:
                pass
                # all_actions = map(lambda x: x.minor_actions,choices)
                # all_bitmaps = map(lambda x: x.final_state.arena.bitmap[-1].flatten(),choices)
                # initial_bitmaps = [s.arena.bitmap[-1].flatten() for i in all_bitmaps]
                # print "{} choices. Bitmaps/Bitmaps/Betas: {}".format(len(choices), list(zip(initial_bitmaps,all_bitmaps,map(lambda x: self.QM.beta(s,x), choices))))
                # raise Exception("TODO")

                p = max(choices, key=lambda x: self.QM.q(s, x))
            self.placement = PartiallyCompletedPlacement(p)
        else:
            debug_info["pfbms"] = []

        return (self.placement.incr_action(), debug_info)

예제 #7

파일 보기

파일: baseline.py 프로젝트: mpaluta/tetris_rl

class LowestCenterOfGravityAgent(object):
    penum=None
    queued_actions=None
    e=None
    def __init__(self,e):
        self.penum=PlacementEnumerator()
        self.queued_actions=[]
        self.e = e

    def act(self,s):
        def score(b):
            row_indices = np.nonzero(b)[0]
            return -row_indices.mean()

        if len(self.queued_actions)>0:
            a = self.queued_actions[0]
            self.queued_actions = self.queued_actions[1:]
            return a
        else:
            bts = self.penum.get_successor_bitmaps(self.e, s)
            assert(len(bts)>0)
            smin,amin,rmin = min(bts, key=lambda x:score(x[0].arena.bitmap))
            self.queued_actions = amin[1:]
            return amin[0]

예제 #8

파일 보기

파일: baseline.py 프로젝트: mkayser/tetris_rl

 def __init__(self,e):
     self.penum=PlacementEnumerator(e)
     self.queued_actions=[]

예제 #9

파일 보기

파일: baseline.py 프로젝트: mpaluta/Tetris-Reinforcement-Learning

 def __init__(self, e):
     self.penum = PlacementEnumerator(e)
     self.queued_actions = []