def test_dummy_sense(self): dummies = [ "Traductions à trier suivant le sens", "Traductions à trier suivant le sens.", "Traductions à trier", "À trier", "à trier", "Traduction à trier", "Traductions à vérifier et à trier", "À trier selon le sens", "Traductions à classer d’après le sens", "traduction à classer", "A trier", "Autres sens à trier", ] for d in dummies: self.assertEqual(is_dummy_sense(d, "fr"), True, d) self.assertEqual(is_dummy_sense("Le sense", "fr"), False)
def test_dummy_sense(self): dummies = [ 'Traductions à trier suivant le sens', 'Traductions à trier suivant le sens.', 'Traductions à trier', 'À trier', 'à trier', 'Traduction à trier', 'Traductions à vérifier et à trier', 'À trier selon le sens', 'Traductions à classer d’après le sens', 'traduction à classer', 'A trier', 'Autres sens à trier', ] for d in dummies: self.assertEqual(is_dummy_sense(d, 'fr'), True, d) self.assertEqual(is_dummy_sense('Le sense', 'fr'), False)
def parse_sense(sense, lang): if sense is None: return None sense = sense.strip() if sense == "": return None sense = parse.clean_wiki_syntax(sense) sense = parse.html_parser.parse(sense) # do this after syntax cleanup to make matches easier if parse.is_dummy_sense(sense, lang): return None return sense