예제 #1
0
파일: iop.py 프로젝트: jjwilke/PySkyNet
 def reset(self):
     ArticleParser.reset(self)
     self.issue = None
     self.text_frame = None
     self.a_text = self.append_text
     self.issue_text = self.append_text
     self.issues = {}
예제 #2
0
파일: aps.py 프로젝트: jjwilke/PySkyNet
    def end_div(self):
        if self.text_frame == "author":
            self.get_text()
            self.text_frame = "blank"
        elif self.text_frame == "blank":
            self.get_text()
            self.text_frame = "pages"
            self.a_frame = "pages"
        elif self.text_frame == "pages":
            text = self.get_text()
            match = re.compile("(\d+.*)PDF", re.DOTALL).search(text)
            if not match: #just ignore this
                self.article = None
                self.a_frame = None
                self.text_frame = None
                ArticleParser.end_div(self)
                return

            text = match.groups()[0]
            match = map(Page, re.compile("\d+").findall(text))

            if len(match) == 1:
                page = match[0]
                self.article.set_pages(page, page)
            elif len(match) == 2:
                start, end = match
                self.article.set_pages(start, end)
            else:
                raise HTMLException("%s is not valid text input for APS parser" % text)

            self.text_frame = None
            self.a_frame = None
        
        ArticleParser.end_div(self)
예제 #3
0
파일: rsc.py 프로젝트: jjwilke/PySkyNet
    def reset(self):
        ArticleParser.reset(self)

        #treat paragraph breaks as divisions
        self.start_p = self.start_div
        self.end_p = self.end_div
        self.title_text = self.append_text
        self.citation_text = self.append_text
예제 #4
0
파일: isi.py 프로젝트: jjwilke/PySkyNet
    def reset(self):
        ArticleParser.reset(self)

        #treat paragraph breaks as divisions
        self.start_p = self.start_div
        self.end_p = self.end_div

        self.citation = []
        self.title = []
예제 #5
0
파일: aps.py 프로젝트: jjwilke/PySkyNet
    def reset(self):
        ArticleParser.reset(self)

        #treat paragraph breaks as divisions
        self.start_p = self.start_div
        self.end_p = self.end_div
        self.pages_text = self.append_text
        self.title_text = self.append_text
        self.author_text = self.append_text
        self.blank_text = self.append_text
예제 #6
0
파일: wiley.py 프로젝트: jjwilke/PySkyNet
    def reset(self):
        ArticleParser.reset(self)

        self.url = None
예제 #7
0
파일: acs.py 프로젝트: jjwilke/PySkyNet
    def reset(self):
        ArticleParser.reset(self)

        self.title_text = self.append_text
        self.pages_text = self.append_text
        self.citation_text = self.append_text
예제 #8
0
파일: iop.py 프로젝트: jjwilke/PySkyNet
 def reset(self):
     ArticleParser.reset(self)
     self.page_text = self.append_text
     self.a_text = self.append_text
     self.url = None