Python SimplifyNormalizer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nazca.utils.normalize

클래스/타입: SimplifyNormalizer

hotexamples.com에서의 예제들: 3

Python SimplifyNormalizer - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nazca.utils.normalize.SimplifyNormalizer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

normalize(2)

normalize_dataset(1)

예제 #1

파일 보기

파일: test_blocking.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_minhashing(self):
     refset = [['V1', 'label1', u"Un nuage flotta dans le grand ciel bleu."],
               ['V2', 'label2', u"Pour quelle occasion vous êtes-vous apprêtée ?"],
               ['V3', 'label3', u"Je les vis ensemble à plusieurs occasions."],
               ['V4', 'label4', u"Je n'aime pas ce genre de bandes dessinées tristes."],
               ['V5', 'label5', u"Ensemble et à plusieurs occasions, je les vis."],
               ]
     targetset = [['T1', 'labelt1', u"Des grands nuages noirs flottent dans le ciel."],
                  ['T2', 'labelt2', u"Je les ai vus ensemble à plusieurs occasions."],
                  ['T3', 'labelt3', u"J'aime les bandes dessinées de genre comiques."],
                  ]
     normalizer = SimplifyNormalizer(attr_index=2, lemmas=FRENCH_LEMMAS)
     refset = normalizer.normalize_dataset(refset)
     targetset = normalizer.normalize_dataset(targetset)
     blocking = MinHashingBlocking(threshold=0.4, ref_attr_index=2, target_attr_index=2)
     blocking.fit(refset, targetset)
     blocks = list(blocking.iter_indice_blocks())
     for align in (([2, 4], [1]), ([0], [0]), ([3], [2])):
         self.assertIn(align, blocks)

예제 #2

파일 보기

파일: test_normalize.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_simplify_record(self):
     normalizer = SimplifyNormalizer(attr_index=1, lemmas=FRENCH_LEMMAS)
     self.assertEqual(['a1', u"aimer frites pomme scoubidou"],
                      normalizer.normalize(['a1', u"J'aime les frites, les pommes "
                                            "et les scoubidous !"]))

예제 #3

파일 보기

파일: test_normalize.py 프로젝트: pombredanne/http-hg.logilab.org-review-nazca

 def test_simplify(self):
     normalizer = SimplifyNormalizer(lemmas=FRENCH_LEMMAS)
     self.assertEqual(normalizer.normalize(u"J'aime les frites, les pommes et les scoubidous !")
                      , u"aimer frites pomme scoubidou")