コード例 #1
0
ファイル: similarity.py プロジェクト: jilljenn/dissemin
 def fetchData(self, author):
     pubs = author.paper.publication_set.all()[:5]
     titles = [a.full_title() for a in pubs]
     for r in author.paper.oairecord_set.all()[:5]:
         if r.keywords:
             titles.append(r.keywords)
     titles = map(lambda t: set(filter_punctuation(tokenize(t))), titles)
     return titles
コード例 #2
0
 def test_filter_punctuation(self):
     self.assertEqual(filter_punctuation(['abc','ab.','/,','a-b','#=', '0']),
                         ['abc', 'ab.', 'a-b', '0'])
コード例 #3
0
ファイル: similarity.py プロジェクト: jilljenn/dissemin
 def fetchData(self, author):
     contributors = [r.contributors for r in author.paper.oairecord_set.all()]
     contributors = filter(lambda x: x != None, contributors)
     ta = ' '.join(contributors)
     return set(filter_punctuation(tokenize(ta)))
コード例 #4
0
ファイル: similarity.py プロジェクト: jilljenn/dissemin
 def fetchData(self, author):
     return set(filter_punctuation(tokenize(author.paper.title)))