Пример #1
0
    def test_parseParagraphs(self):

        self.assertEqual([u"Paragraph One", u"Paragraph Two"],
            Parser.parseParagraphs(u"Paragraph One\nParagraph Two"))
        self.assertEqual([u"Paragraph One", u"Paragraph Two"],
            Parser.parseParagraphs(u"Paragraph One\n\nParagraph Two"))
        self.assertEqual([u"Paragraph One", u"Paragraph Two"],
            Parser.parseParagraphs(u"Paragraph One\n \nParagraph Two"))
        self.assertEqual([u"Paragraph One", u"Paragraph Two"],
            Parser.parseParagraphs(u"Paragraph One\n\n\nParagraph Two"))
Пример #2
0
    def test_findHeadings(self):

        testdata = u"""
最終話 つきひフェニックス

 001

 阿良々木月火《あららぎつきひ》の正体を開示することによって、それではいよいよ僕達の物語に終止符を打つことにしよう。あの小賢しくも小うるさい、ちっちゃいほうの妹の話で、僕と、僕の愛すべき仲間たちのエピソードは完結だ。とは言うものの、勿論《もちろん》それで人生が終わるわけじやないし、世界が終わるわけでもない。
 どうしたところで命まで取られるわけじゃあるまいし――大体、終わりのある人生や終わりのある世界が、どれほど救済的なのか、僕達はそのことに、普段からもっと思いを馳《は》せるべきだろう。終わりたくても終われない、やめたくてもやめられない、そんな地獄《じごく》を人間は日常的に、あるいは異常的に、当たり前のように経験し、当たり前のように継続しているはずではないか。

This is not a 001 heading 
        """

        paragraphs = Parser.parseParagraphs(testdata)
        headingslist = Parser.findHeadings(paragraphs)

        self.assertEqual(headingslist, [1])
Пример #3
0
    def test_pageSplit(self):
        
        testdata = u"""
This is the first page.
And this is too.
[#改ページ]
Second page.
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
12345678901234567890
1234567890
This should be page three.
[#改ページ]

This should be page four.
"""
        
        paragraphs = Parser.parseParagraphs(testdata)
        pages = Parser.pageSplit(paragraphs)

        self.assertEqual(pages[0][0], u"This is the first page.")
        self.assertEqual(pages[1][0], u"Second page.")
        self.assertEqual(pages[2][0], u"This should be page three.")
        self.assertEqual(pages[3][0], u"This should be page four.")