Ejemplo n.º 1
0
Archivo: parsers.py Proyecto: ICCV/mimr
 def gen_content_ne(self):
     content_tokens = self._pure_tokenize_content()
     names = TextPreprocesser.gen_ner(content_tokens)
     return names
Ejemplo n.º 2
0
Archivo: parsers.py Proyecto: ICCV/mimr
 def gen_title_ne(self):
     title_tokens = self._pure_tokenize_title()
     names = TextPreprocesser.gen_ner(title_tokens)
     return names
Ejemplo n.º 3
0
Archivo: parsers.py Proyecto: ICCV/mimr
 def gen_tokenized_content(self):
     tokens = self._pure_tokenize_content()
     tokens = TextPreprocesser.filter(tokens)
     return tokens
Ejemplo n.º 4
0
Archivo: parsers.py Proyecto: ICCV/mimr
 def gen_tokenized_title(self):
     tokens = self._pure_tokenize_title()
     tokens = TextPreprocesser.filter(tokens)
     return tokens
Ejemplo n.º 5
0
Archivo: parsers.py Proyecto: ICCV/mimr
 def _pure_tokenize_content(self):
     if self._tokenized_content is None:
         self._tokenized_content = TextPreprocesser.tokenizor(self.content)
     return self._tokenized_content
Ejemplo n.º 6
0
Archivo: parsers.py Proyecto: ICCV/mimr
 def _pure_tokenize_title(self):
     if self._tokenized_title is None:
         self._tokenized_title = TextPreprocesser.tokenizor(self.title)
     return self._tokenized_title