コード例 #1
0
ファイル: parsers.py プロジェクト: ICCV/mimr
 def gen_content_ne(self):
     content_tokens = self._pure_tokenize_content()
     names = TextPreprocesser.gen_ner(content_tokens)
     return names
コード例 #2
0
ファイル: parsers.py プロジェクト: ICCV/mimr
 def gen_title_ne(self):
     title_tokens = self._pure_tokenize_title()
     names = TextPreprocesser.gen_ner(title_tokens)
     return names
コード例 #3
0
ファイル: parsers.py プロジェクト: ICCV/mimr
 def gen_tokenized_content(self):
     tokens = self._pure_tokenize_content()
     tokens = TextPreprocesser.filter(tokens)
     return tokens
コード例 #4
0
ファイル: parsers.py プロジェクト: ICCV/mimr
 def gen_tokenized_title(self):
     tokens = self._pure_tokenize_title()
     tokens = TextPreprocesser.filter(tokens)
     return tokens
コード例 #5
0
ファイル: parsers.py プロジェクト: ICCV/mimr
 def _pure_tokenize_content(self):
     if self._tokenized_content is None:
         self._tokenized_content = TextPreprocesser.tokenizor(self.content)
     return self._tokenized_content
コード例 #6
0
ファイル: parsers.py プロジェクト: ICCV/mimr
 def _pure_tokenize_title(self):
     if self._tokenized_title is None:
         self._tokenized_title = TextPreprocesser.tokenizor(self.title)
     return self._tokenized_title