예제 #1
0
파일: corpus.py 프로젝트: kareem180/corpkit
 def __init__(self, path, dirname):
     import os
     from os.path import join, isfile, isdir
     self.path = join(dirname, path)
     kwargs = {'print_info': False, 'level': 'f'}
     Corpus.__init__(self, self.path, **kwargs)
     if self.path.endswith('.p'):
         self.datatype = 'tokens'
     elif self.path.endswith('.xml'):
         self.datatype = 'parse'
     else:
         self.datatype = 'plaintext'
예제 #2
0
파일: corpus.py 프로젝트: kareem180/corpkit
 def __init__(self, path):
     self.path = path
     kwargs = {'print_info': False, 'level': 's'}
     Corpus.__init__(self, self.path, **kwargs)