Python ArticleParser示例

编程语言: Python

命名空间/包名称: papers.pdfget

类/类型: ArticleParser

hotexamples.com的示例: 8

Python ArticleParser - 已找到8个示例。这些是从开源项目中提取的最受好评的papers.pdfget.ArticleParser现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

reset(7)

end_div(1)

示例#1

显示文件

文件： iop.py 项目： jjwilke/PySkyNet

 def reset(self):
     ArticleParser.reset(self)
     self.issue = None
     self.text_frame = None
     self.a_text = self.append_text
     self.issue_text = self.append_text
     self.issues = {}

示例#2

显示文件

文件： aps.py 项目： jjwilke/PySkyNet

    def end_div(self):
        if self.text_frame == "author":
            self.get_text()
            self.text_frame = "blank"
        elif self.text_frame == "blank":
            self.get_text()
            self.text_frame = "pages"
            self.a_frame = "pages"
        elif self.text_frame == "pages":
            text = self.get_text()
            match = re.compile("(\d+.*)PDF", re.DOTALL).search(text)
            if not match: #just ignore this
                self.article = None
                self.a_frame = None
                self.text_frame = None
                ArticleParser.end_div(self)
                return

            text = match.groups()[0]
            match = map(Page, re.compile("\d+").findall(text))

            if len(match) == 1:
                page = match[0]
                self.article.set_pages(page, page)
            elif len(match) == 2:
                start, end = match
                self.article.set_pages(start, end)
            else:
                raise HTMLException("%s is not valid text input for APS parser" % text)

            self.text_frame = None
            self.a_frame = None
        
        ArticleParser.end_div(self)

示例#3

显示文件

文件： rsc.py 项目： jjwilke/PySkyNet

    def reset(self):
        ArticleParser.reset(self)

        #treat paragraph breaks as divisions
        self.start_p = self.start_div
        self.end_p = self.end_div
        self.title_text = self.append_text
        self.citation_text = self.append_text

示例#4

显示文件

文件： isi.py 项目： jjwilke/PySkyNet

    def reset(self):
        ArticleParser.reset(self)

        #treat paragraph breaks as divisions
        self.start_p = self.start_div
        self.end_p = self.end_div

        self.citation = []
        self.title = []

示例#5

显示文件

文件： aps.py 项目： jjwilke/PySkyNet

    def reset(self):
        ArticleParser.reset(self)

        #treat paragraph breaks as divisions
        self.start_p = self.start_div
        self.end_p = self.end_div
        self.pages_text = self.append_text
        self.title_text = self.append_text
        self.author_text = self.append_text
        self.blank_text = self.append_text

示例#6

显示文件

文件： wiley.py 项目： jjwilke/PySkyNet

    def reset(self):
        ArticleParser.reset(self)

        self.url = None

示例#7

显示文件

文件： acs.py 项目： jjwilke/PySkyNet

    def reset(self):
        ArticleParser.reset(self)

        self.title_text = self.append_text
        self.pages_text = self.append_text
        self.citation_text = self.append_text

示例#8

显示文件

文件： iop.py 项目： jjwilke/PySkyNet

 def reset(self):
     ArticleParser.reset(self)
     self.page_text = self.append_text
     self.a_text = self.append_text
     self.url = None