コード例 #1
0
 def test_026(self):
     """ Document [] setter """
     document = Document("test.txt")
     page = Page(text='hello world')
     document[0] = page
     self.assertEqual(document[0].text, "hello world")
     os.remove("test1.txt")
コード例 #2
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_039(self):
     """ segment option - paragraphs """
     segment = Segment('para 1\n\npara 2')
     page = Page(text=segment.segments)
     self.assertEqual(page.text, 'para 1\n\npara 2')
     self.assertEqual(page.size, 16)
     self.assertEqual(page.words, [{ 'tag': 1002, 'words': [{ 'tag': 0, 'word': 'para'}]}, { 'tag': 1002, 'words': [{ 'tag': 0, 'word': 'para'}]}])
コード例 #3
0
 def test_028(self):
     """ Document [] setter - not an int index """
     document = Document("test.txt")
     page = Page(text='hello world')
     with pytest.raises(TypeError):
         document['abc'] = page
     os.remove("test1.txt")
コード例 #4
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_026(self):
     """ Page overridden += : words is non-None """
     page = Page(text="hello")
     self.assertEqual(len(page), 1)
     page += "world"
     self.assertEqual(page.text, "hello world")
     self.assertEqual(len(page), 2)
コード例 #5
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_032(self):
     """ Page store/load """
     page = Page(text="hello world, goodbye")
     page.store('files/tmp.txt')
     page._words = None
     page.load('files/tmp.txt')
     os.remove("files/tmp.txt")
     self.assertEqual(towords(page.words), ["hello", "world", "goodbye"])
コード例 #6
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def xtest_bugs(self):
     """ Page store/load - unicode - cryllic """
     page = Page(text="Й й")
     page.store('files/tmp.txt')
     page._words = None
     page.load('files/tmp.txt')
     os.remove("files/tmp.txt")
     self.assertEqual(towords(page.words), ["Й", "й"])
コード例 #7
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_008(self):
     """ Page constructor - path is not a file """
     with pytest.raises(FileNotFoundError):
         page = Page(path='files/nonexist.txt')
コード例 #8
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_006(self):
     """ Page constructor - path is not a string """
     with pytest.raises(TypeError):
         page = Page(path=12)
コード例 #9
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_007(self):
     """ Page constructor - text is not a string """
     with pytest.raises(TypeError):
         page = Page(text=12)
コード例 #10
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_001(self):
     """ Page constructor - no parameters """
     page = Page()
     self.assertEqual(page.path,  None)
     self.assertEqual(page.text,  None)
     self.assertEqual(page.words, None)
コード例 #11
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_036(self):
     """ Page - Term Frequency """
     page = Page(text="zoo castle zoo bird zoo bird zoo bird")
     self.assertEqual(page.termFreq, [( 'zoo', 0.5), ('bird', 0.375), ('castle', 0.125 )])   
コード例 #12
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_011(self):
     """ Page path setter - not a valid file """
     page = Page()
     with pytest.raises(FileNotFoundError):
         page.path = 'files/nonexist.txt'
コード例 #13
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_013(self):
     """ Page text getter/setter """
     page = Page()
     self.assertEqual(page.text,  None)
     page.text = "hello world"
     self.assertEqual(page.text,  'hello world')
コード例 #14
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_043(self):
     """ load() - not a valid type """
     page = Page()
     with pytest.raises(TypeError):
         page.load(12)
コード例 #15
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_044(self):
     """ load() - not a valid path """
     page = Page()
     with pytest.raises(FileNotFoundError):
         page.load('foo/goo/hoo.json')
コード例 #16
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_040(self):
     """ segment option - path and segments """
     with open('files/segment_para.txt', 'r', encoding="utf-8") as f:
         segment = Segment(f.read())
     page = Page('files/segment_para.txt', segment.segments)
コード例 #17
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_041(self):
     """ store() - not a valid type """
     page = Page()
     with pytest.raises(TypeError):
         page.store(12)
コード例 #18
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_034(self):
     """ Page - Bag of Words """
     page = Page(text="zoo castle zoo bird zoo bird")
     self.assertEqual(page.bagOfWords, { 'zoo': 3, 'castle': 1, 'bird': 2 })    
コード例 #19
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_038(self):
     """ segment option - element not a dictionary """
     with pytest.raises(TypeError):
         page = Page(text=[ 3 ])
コード例 #20
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_037(self):
     """ segment option - empty list """
     page = Page(text=[])
     self.assertEqual(page.words, [])
コード例 #21
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_009(self):
     """ Page path getter/setter """
     page = Page()
     self.assertEqual(page.path,  None)
     page.path = "files/test.txt"
     self.assertEqual(page.path,  'files/test.txt')
コード例 #22
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_031(self):
     """ Page number """
     page = Page("files/test.txt")
     self.assertEqual(page.pageno, None)
     page = Page("files/test.txt", pageno=2)
     self.assertEqual(page.pageno, 2)
コード例 #23
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_010(self):
     """ Page path setter - not a string """
     page = Page()
     with pytest.raises(TypeError):
         page.path = 12
コード例 #24
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_003(self):
     """ Page constructor - path and text parameter """
     page = Page("files/test.txt", "foo")
     self.assertEqual(page.path,  "files/test.txt")
     self.assertEqual(page.text,  "foo")
     self.assertEqual(towords(page.words), [ "foo" ] )
コード例 #25
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_012(self):
     """ Page path setter - None """
     page = Page()
     page.path = None
     self.assertEqual(page.path,  None)
コード例 #26
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_004(self):
     """ Page constructor - path keyword parameter """
     page = Page(path="files/test.txt")
     self.assertEqual(page.path,  "files/test.txt")
     self.assertEqual(page.text,  None)
     self.assertEqual(page.words, None)
コード例 #27
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_033(self):
     """ Page store/load - unicode - latin """
     page = Page(text="hāllo world, goodbye")
     page.store('files/tmp.txt')
     page._words = None
     page.load('files/tmp.txt')
     self.assertEqual(towords(page.words), ["hāllo", "world", "goodbye"])
     os.remove("files/tmp.txt")
     Page.ROMAN = True
     page = Page(text="québec")
     page.store('files/tmp.txt')
     page._words = None
     page.load('files/tmp.txt')
     Page.ROMAN = False
     self.assertEqual(towords(page.words), ["quebec"])
     os.remove("files/tmp.txt")    
コード例 #28
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_005(self):
     """ Page constructor - path keyword parameter """
     page = Page(text="foo")
     self.assertEqual(page.path,  None)
     self.assertEqual(page.text,  'foo')
     self.assertEqual(towords(page.words), ["foo"])
コード例 #29
0
 def test_033(self):
     """ Document overridden str() """
     document = Document("test.txt")
     document += Page()
     self.assertEqual(len(document), 2)
     os.remove("test1.txt")
コード例 #30
0
ファイル: page_test.py プロジェクト: virtualdvid/NLP
 def test_035(self):
     """ Page - Word Counts """
     page = Page(text="zoo castle zoo bird zoo bird")
     self.assertEqual(page.freqDist, [( 'zoo', 3), ('bird', 2), ('castle', 1 )])