コード例 #1
0
 def test_DocxParser(self):
     docx = DocxParser()
     docx.parse('files/Test.docx')
     text = [
         'i', 'test', 'poop', 'test', 'anim', 'test', 'anim', 'googl',
         'link'
     ]
     assert docx.get_processed_stems() == text
コード例 #2
0
 def test_get_processed_stems(self):
     abstract = DocxParser()
     abstract.parse('files/Test.docx')
     text = [
         'i', 'test', 'poop', 'test', 'anim', 'test', 'anim', 'googl',
         'link'
     ]
     assert abstract.get_processed_stems() == text
コード例 #3
0
 def test_get_stems(self):
     abstract = DocxParser()
     abstract.parse('files/Test.docx')
     text = [
         'i', 'am', 'test', 'here', 'poops,', 'test', 'animals,', 'test',
         'anim', 'something.', 'googl', 'link'
     ]
     assert abstract.get_stems() == text
コード例 #4
0
ファイル: main.py プロジェクト: koshreality/TextExtracting
def docx_test():
    docx_parser = DocxParser()
    docx_parser.parse(r'D:\Test22.docx')
    print(docx_parser.get_processed_stems())
コード例 #5
0
ファイル: main.py プロジェクト: Mashkin232/parsers
def docx():
    docx_parser = DocxParser()
    docx_parser.parse(r'files/Test2.docx')
    print('docx parser', docx_parser.get_processed_stems(),
          len(docx_parser.get_processed_stems()))
コード例 #6
0
 def test_get_processed_text(self):
     abstract = DocxParser()
     abstract.parse('files/Test.docx')
     text = "I test poops Test animals tests animal google link"
     assert abstract.get_processed_text() == text
コード例 #7
0
 def test_get_text(self):
     abstract = DocxParser()
     abstract.parse('files/Test.docx')
     text = "I am test here poops,  Test animals, tests animal something. google link"
     assert abstract.get_text() == text