def test_parseParagraphs(self): self.assertEqual([u"Paragraph One", u"Paragraph Two"], Parser.parseParagraphs(u"Paragraph One\nParagraph Two")) self.assertEqual([u"Paragraph One", u"Paragraph Two"], Parser.parseParagraphs(u"Paragraph One\n\nParagraph Two")) self.assertEqual([u"Paragraph One", u"Paragraph Two"], Parser.parseParagraphs(u"Paragraph One\n \nParagraph Two")) self.assertEqual([u"Paragraph One", u"Paragraph Two"], Parser.parseParagraphs(u"Paragraph One\n\n\nParagraph Two"))
def test_findHeadings(self): testdata = u""" 最終話 つきひフェニックス 001 阿良々木月火《あららぎつきひ》の正体を開示することによって、それではいよいよ僕達の物語に終止符を打つことにしよう。あの小賢しくも小うるさい、ちっちゃいほうの妹の話で、僕と、僕の愛すべき仲間たちのエピソードは完結だ。とは言うものの、勿論《もちろん》それで人生が終わるわけじやないし、世界が終わるわけでもない。 どうしたところで命まで取られるわけじゃあるまいし――大体、終わりのある人生や終わりのある世界が、どれほど救済的なのか、僕達はそのことに、普段からもっと思いを馳《は》せるべきだろう。終わりたくても終われない、やめたくてもやめられない、そんな地獄《じごく》を人間は日常的に、あるいは異常的に、当たり前のように経験し、当たり前のように継続しているはずではないか。 This is not a 001 heading """ paragraphs = Parser.parseParagraphs(testdata) headingslist = Parser.findHeadings(paragraphs) self.assertEqual(headingslist, [1])
def test_pageSplit(self): testdata = u""" This is the first page. And this is too. [#改ページ] Second page. 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 12345678901234567890 1234567890 This should be page three. [#改ページ] This should be page four. """ paragraphs = Parser.parseParagraphs(testdata) pages = Parser.pageSplit(paragraphs) self.assertEqual(pages[0][0], u"This is the first page.") self.assertEqual(pages[1][0], u"Second page.") self.assertEqual(pages[2][0], u"This should be page three.") self.assertEqual(pages[3][0], u"This should be page four.")