コード例 #1
0
ファイル: pqueue.py プロジェクト: dima-kov/parser
 def populate_with_searches(self):
     print("Populating from search:")
     for keyword in config.START_KEYWORDS:
         page = Page()
         page.url = "https://www.google.com.ua/search?q={}+articles".format(
             keyword)
         page.save()
         self.put(page.url)
コード例 #2
0
ファイル: document_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_026(self):
     """ Document [] setter """
     document = Document("test.txt")
     page = Page(text='hello world')
     document[0] = page
     self.assertEqual(document[0].text, "hello world")
     os.remove("test1.txt")    
コード例 #3
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_026(self):
     """ Page overridden += : words is non-None """
     page = Page(text="hello")
     self.assertEqual(len(page), 1)
     page += "world"
     self.assertEqual(page.text, "hello world")
     self.assertEqual(len(page), 2)
コード例 #4
0
ファイル: document_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_028(self):
     """ Document [] setter - not an int index """
     document = Document("test.txt")
     page = Page(text='hello world')
     with pytest.raises(TypeError):
         document['abc'] = page
     os.remove("test1.txt")
コード例 #5
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def xtest_bugs(self):
     """ Page store/load - unicode - cryllic """
     page = Page(text="Й й")
     page.store('tmp.txt')
     page._words = None
     page.load('tmp.txt')
     os.remove("tmp.txt")
     self.assertEqual(towords(page.words), ["Й", "й"])
コード例 #6
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_032(self):
     """ Page store/load """
     page = Page(text="hello world, goodbye")
     page.store('tmp.txt')
     page._words = None
     page.load('tmp.txt')
     os.remove("tmp.txt")
     self.assertEqual(towords(page.words), ["hello", "world", "goodbye"])
コード例 #7
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_005(self):
     """ Page constructor - path keyword parameter """
     page = Page(text="foo")
     self.assertEqual(page.path, None)
     self.assertEqual(page.text, 'foo')
     self.assertEqual(towords(page.words), ["foo"])
コード例 #8
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_004(self):
     """ Page constructor - path keyword parameter """
     page = Page(path="test.txt")
     self.assertEqual(page.path, "test.txt")
     self.assertEqual(page.text, None)
     self.assertEqual(page.words, None)
コード例 #9
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_003(self):
     """ Page constructor - path and text parameter """
     page = Page("test.txt", "foo")
     self.assertEqual(page.path, "test.txt")
     self.assertEqual(page.text, "foo")
     self.assertEqual(towords(page.words), ["foo"])
コード例 #10
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_027(self):
     """ Page words getter  """
     page = Page(text="hello world")
     self.assertEqual(towords(page.words), ['hello', 'world'])
コード例 #11
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_012(self):
     """ Page path setter - None """
     page = Page()
     page.path = None
     self.assertEqual(page.path, None)
コード例 #12
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_010(self):
     """ Page path setter - not a string """
     page = Page()
     with pytest.raises(TypeError):
         page.path = 12
コード例 #13
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_008(self):
     """ Page constructor - path is not a file """
     with pytest.raises(FileNotFoundError):
         page = Page(path='nonexist.txt')
コード例 #14
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_033(self):
     """ Page store/load - unicode - latin """
     page = Page(text="hāllo world, goodbye")
     page.store('tmp.txt')
     page._words = None
     page.load('tmp.txt')
     self.assertEqual(towords(page.words), ["hāllo", "world", "goodbye"])
     os.remove("tmp.txt")
     Page.ROMAN = True
     page = Page(text="québec")
     page.store('tmp.txt')
     page._words = None
     page.load('tmp.txt')
     Page.ROMAN = False
     self.assertEqual(towords(page.words), ["quebec"])
     os.remove("tmp.txt")
コード例 #15
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_031(self):
     """ Page number """
     page = Page("test.txt")
     self.assertEqual(page.pageno, None)
     page = Page("test.txt", pageno=2)
     self.assertEqual(page.pageno, 2)
コード例 #16
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_030(self):
     """ Page size getter - text  """
     page = Page(text="hello world")
     self.assertEqual(page.size, 11)
コード例 #17
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_029(self):
     """ Page size getter - no text  """
     page = Page(text="")
     self.assertEqual(page.size, 0)
コード例 #18
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_028(self):
     """ Page size getter - no page  """
     page = Page()
     self.assertEqual(page.size, 0)
コード例 #19
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_006(self):
     """ Page constructor - path is not a string """
     with pytest.raises(TypeError):
         page = Page(path=12)
コード例 #20
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_034(self):
     """ Page - Bag of Words """
     page = Page(text="zoo castle zoo bird zoo bird")
     self.assertEqual(page.bagOfWords, {'zoo': 3, 'castle': 1, 'bird': 2})
コード例 #21
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_007(self):
     """ Page constructor - text is not a string """
     with pytest.raises(TypeError):
         page = Page(text=12)
コード例 #22
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_035(self):
     """ Page - Word Counts """
     page = Page(text="zoo castle zoo bird zoo bird")
     self.assertEqual(page.freqDist, [('zoo', 3), ('bird', 2),
                                      ('castle', 1)])
コード例 #23
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_009(self):
     """ Page path getter/setter """
     page = Page()
     self.assertEqual(page.path, None)
     page.path = "test.txt"
     self.assertEqual(page.path, 'test.txt')
コード例 #24
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_014(self):
     """ Page text setter - not a string """
     page = Page()
     with pytest.raises(TypeError):
         page.text = 12
コード例 #25
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_011(self):
     """ Page path setter - not a valid file """
     page = Page()
     with pytest.raises(FileNotFoundError):
         page.path = 'nonexist.txt'
コード例 #26
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_001(self):
     """ Page constructor - no parameters """
     page = Page()
     self.assertEqual(page.path, None)
     self.assertEqual(page.text, None)
     self.assertEqual(page.words, None)
コード例 #27
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_013(self):
     """ Page text getter/setter """
     page = Page()
     self.assertEqual(page.text, None)
     page.text = "hello world"
     self.assertEqual(page.text, 'hello world')
コード例 #28
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_025(self):
     """ Page overridden += : text is non-None, self._text is non-None """
     page = Page(text="hello")
     page += "world"
     self.assertEqual(page.text, "hello world")
コード例 #29
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_036(self):
     """ Page - Term Frequency """
     page = Page(text="zoo castle zoo bird zoo bird zoo bird")
     self.assertEqual(page.termFreq, [('zoo', 0.5), ('bird', 0.375),
                                      ('castle', 0.125)])
コード例 #30
0
ファイル: page_test.py プロジェクト: JoshuaWhittemore/Gap
 def test_022(self):
     """ Page overridden += : text is None, self._text is None """
     page = Page()
     page += None
     self.assertEqual(page.text, None)