def test_idempotence(self): #calling the guessing functions more than one time should not make any difference name = Name('Jelle Gerbrandy') name.guess_normal_form() xml1 = name.to_string() name.guess_normal_form() xml2 = name.to_string() name.guess_geslachtsnaam() xml3 = name.to_string() self.assertEqual(xml1, xml2) self.assertEqual(xml1, xml3)
def test_volledige_naam(self): n = Name(voornaam='Jelle') self.assertEqual(n.get_volledige_naam(),'Jelle') n.guess_geslachtsnaam() self.assertEqual(n.get_volledige_naam(),'Jelle') n = Name().from_string("""<persName> <name type="voornaam">Hendrik IV</name> </persName>""") self.assertEqual(n.get_volledige_naam(), 'Hendrik IV') naam = Name(voornaam='Hendrik IV') self.assertEqual(naam.get_volledige_naam(), u'Hendrik IV')
def test_volledige_naam(self): n = Name(voornaam='Jelle') self.assertEqual(n.get_volledige_naam(), 'Jelle') n.guess_geslachtsnaam() self.assertEqual(n.get_volledige_naam(), 'Jelle') n = Name().from_string("""<persName> <name type="voornaam">Hendrik IV</name> </persName>""") self.assertEqual(n.get_volledige_naam(), 'Hendrik IV') naam = Name(voornaam='Hendrik IV') self.assertEqual(naam.get_volledige_naam(), 'Hendrik IV')
def test_guess_normal_form(self): self.assertEqual(Name('Arien A').guess_normal_form(), 'A, Arien'), for n, wanted_result in [ (Name().from_args(geslachtsnaam='A', volledige_naam='Arien A'), 'A, Arien'), (Name('Brugse Meester van 1493'), 'Brugse Meester van 1493'), (Name('Th.W. Engelmann'), 'Engelmann, Th.W.'), (Name('A. Algra'), 'Algra, A.'), # (Name().from_string('<persName>A. Algra</persName>'), 'Algra A.') (Name('(G. Morton)'), 'Morton, G.'), (Name('Di(e)ck, Jan Gerard'), 'Dick, Jan Gerard'), (Name('Arien A'), 'A, Arien'), (Name('David Heilbron Cz.'), 'Heilbron Cz., David'), (Name('Johann (Johan) VII'), 'Johann VII'), (Name('Johann VII'), 'Johann VII'), # (Name('koning Willem III') , 'Willem III' ), (Name('Crato, graaf van Nassau-Saarbrück'), 'Crato, graaf van Nassau-Saarbrück'), (Name('Wilhelmina van Pruisen - prinses van Oranje-Nassau'), 'Wilhelmina van Pruisen - prinses van Oranje-Nassau'), (Name('Henriette Adriana Louise Flora d\'Oultremont de Wégimont'), "d'Oultremont de Wégimont, Henriette Adriana Louise Flora"), (Name( 'Wolrat, vorst van Nassau-Usingen dikwijls genoemd Nassau-Saarbrück' ), 'Wolrat, vorst van Nassau-Usingen dikwijls genoemd Nassau-Saarbrück' ), (Name('van \'s-Gravezande, Arnoldus Corneluszn. Storm'), 's-Gravezande, Arnoldus Corneluszn. Storm, van'), (Name('L.T. graaf van Nassau La Lecq'), 'L.T. graaf van Nassau La Lecq'), (Name('Géo d\'Aconit'), 'd\'Aconit, Géo'), (Name('J. Heemskerk Azn.'), 'Heemskerk Azn., J.'), ]: guessed = n.guess_normal_form() self.assertEqual(guessed, wanted_result) self.assertEqual(Name('A').guess_normal_form(), 'A'), self.assertEqual( Name('Hendrik ten Brink Hz.').guess_normal_form(), 'Brink Hz., Hendrik ten'), n1 = etree.fromstring( '<persName>Kees van Dongen</persName>') #@UndefinedVariable n1 = Name().from_xml(n1) self.assertEqual(n1.guess_geslachtsnaam(), 'Dongen') self.assertEqual(n1.guess_normal_form(), 'Dongen, Kees van') n1 = etree.fromstring( '<persName>Dongen, Kees van</persName>') #@UndefinedVariable n1 = Name().from_xml(n1) self.assertEqual(n1.guess_normal_form(), 'Dongen, Kees van')
def test_guess_normal_form(self): self.assertEqual(Name('Arien A').guess_normal_form(), 'A, Arien'), for n, wanted_result in [ (Name().from_args(geslachtsnaam='A', volledige_naam='Arien A'), 'A, Arien'), (Name('Brugse Meester van 1493'), 'Brugse Meester van 1493'), (Name('Th.W. Engelmann'), 'Engelmann, Th.W.'), (Name('A. Algra'), 'Algra, A.'), # (Name().from_string('<persName>A. Algra</persName>'), 'Algra A.') (Name('(G. Morton)'), 'Morton, G.'), (Name('Di(e)ck, Jan Gerard'), 'Dick, Jan Gerard'), (Name('Arien A'), 'A, Arien'), (Name('David Heilbron Cz.'), 'Heilbron Cz., David'), (Name('Johann (Johan) VII'), 'Johann VII' ), (Name('Johann VII'), 'Johann VII' ), # (Name('koning Willem III') , 'Willem III' ), (Name(u'Crato, graaf van Nassau-Saarbrück'), u'Crato, graaf van Nassau-Saarbrück'), (Name(u'Wilhelmina van Pruisen - prinses van Oranje-Nassau'), 'Wilhelmina van Pruisen - prinses van Oranje-Nassau'), (Name(u'Henriette Adriana Louise Flora d\'Oultremont de Wégimont'), u"d'Oultremont de Wégimont, Henriette Adriana Louise Flora"), (Name(u'Wolrat, vorst van Nassau-Usingen dikwijls genoemd Nassau-Saarbrück'), u'Wolrat, vorst van Nassau-Usingen dikwijls genoemd Nassau-Saarbrück'), (Name(u'van \'s-Gravezande, Arnoldus Corneluszn. Storm'), 's-Gravezande, Arnoldus Corneluszn. Storm, van'), (Name('L.T. graaf van Nassau La Lecq'), 'L.T. graaf van Nassau La Lecq'), (Name(u'Géo d\'Aconit'), u'd\'Aconit, Géo'), (Name(u'J. Heemskerk Azn.'), u'Heemskerk Azn., J.'), ]: guessed = n.guess_normal_form() self.assertEqual(guessed, wanted_result) self.assertEqual(Name('A').guess_normal_form(), 'A'), self.assertEqual(Name('Hendrik ten Brink Hz.').guess_normal_form(), 'Brink Hz., Hendrik ten'), n1 = etree.fromstring('<persName>Kees van Dongen</persName>') #@UndefinedVariable n1 = Name().from_xml(n1) self.assertEqual(n1.guess_geslachtsnaam(), 'Dongen') self.assertEqual(n1.guess_normal_form(), 'Dongen, Kees van') n1 = etree.fromstring('<persName>Dongen, Kees van</persName>') #@UndefinedVariable n1 = Name().from_xml(n1) self.assertEqual(n1.guess_normal_form(), 'Dongen, Kees van')
def test_normal_form(self): s ='<persName>Jelle <name type="geslachtsnaam">Gerbrandy</name></persName>' naam = Name().from_string(s) self.assertEqual(naam.geslachtsnaam(), u'Gerbrandy') self.assertEqual(naam.guess_normal_form(), u'Gerbrandy, Jelle') self.assertEqual(naam.guess_normal_form2(), u'Jelle Gerbrandy') naam = Name('Jelle Gerbrandy') self.assertEqual(naam.guess_normal_form(), u'Gerbrandy, Jelle') naam.guess_geslachtsnaam() self.assertEqual(naam.guess_normal_form2(), u'Jelle Gerbrandy') naam = Name('Gerbrandy, Jelle') self.assertEqual(naam.guess_normal_form(), u'Gerbrandy, Jelle') self.assertEqual(naam.guess_normal_form2(), u'Jelle Gerbrandy') naam = Name(voornaam='Hendrik IV') self.assertEqual(naam.geslachtsnaam(), '') self.assertEqual(naam.guess_normal_form(), u'Hendrik IV') self.assertEqual(naam.guess_normal_form2(), u'Hendrik IV') n = Name().from_string("""<persName> <name type="voornaam">Hendrik IV</name> </persName>""") n.guess_geslachtsnaam() assert not n.geslachtsnaam(), n.to_string() self.assertEqual(n.guess_normal_form(), 'Hendrik IV') self.assertEqual(naam.guess_normal_form2(), u'Hendrik IV') s = """<persName> <name type="geslachtsnaam">Xerxes</name> </persName>""" n = Name().from_string(s) self.assertEqual(n.guess_normal_form(), 'Xerxes') s = '<persName><name type="geslachtsnaam">A</name>, Arien</persName>' n = Name().from_string(s) self.assertEqual(n.guess_normal_form(), 'A, Arien') self.assertEqual(n.guess_normal_form2(), 'Arien A') n = Name('A.B.J.Teulings') self.assertEqual(n.guess_normal_form(), 'Teulings, A.B.J.') self.assertEqual(n.guess_normal_form2(), 'A.B.J.Teulings') naam = Name('JOHAN (Johann) VII') self.assertEqual(naam.guess_normal_form(), 'Johan VII') naam = Name().from_string('<persName><name type="geslachtsnaam">Dirk</name>, VI, Theodericus</persName>') self.assertEqual(naam.guess_normal_form(), 'Dirk, VI, Theodericus') naam = Name('Lodewijk XVIII') self.assertEqual(naam.guess_normal_form2(), 'Lodewijk XVIII') s = """<persName> <name type="voornaam">Trijn</name> <name type="intrapositie">van</name> <name type="geslachtsnaam">Leemput</name></persName>""" naam = Name().from_string(s) self.assertEqual(naam.guess_normal_form(), 'Leemput, Trijn van') self.assertEqual(naam.guess_normal_form2(), 'Trijn van Leemput') n5 = Name('Piet Gerbrandy', geslachtsnaam='Gerbrandy') self.assertEqual(n5.guess_normal_form(), 'Gerbrandy, Piet') self.assertEqual(n5.guess_normal_form2(), 'Piet Gerbrandy') # n6 = Name('Piet Gerbrandy', geslachtsnaam='Piet') # n6._tokenize() # self.assertEqual(n6.guess_normal_form(), 'Piet Gerbrandy') # self.assertEqual(n6.guess_normal_form2(), 'Gerbrandy Piet') n = Name('Hermansz') self.assertEqual(n.guess_normal_form(), 'Hermansz') self.assertEqual(n.geslachtsnaam(), 'Hermansz') n = Name('Ada, van Holland (1)') self.assertEqual(n.guess_normal_form(), 'Ada, van Holland') n = Name('Hees - B.P. van') self.assertEqual(n.guess_normal_form(), 'Hees - B.P. van') n = Name('Hees - B.P. van (1234-1235)') self.assertEqual(n.guess_normal_form(), 'Hees - B.P. van') n = Name('Hoeven, Abraham des Amorie van der (1)') self.assertEqual(n.guess_normal_form(), 'Hoeven, Abraham des Amorie van der') self.assertEqual(n.guess_normal_form2(), 'Abraham des Amorie van der Hoeven') n = Name('Schepper, Gerhard Antoni IJssel de') self.assertEqual(n.guess_normal_form(), 'Schepper, Gerhard Antoni IJssel de')
def test_normal_form(self): s = '<persName>Jelle <name type="geslachtsnaam">Gerbrandy</name></persName>' naam = Name().from_string(s) self.assertEqual(naam.geslachtsnaam(), 'Gerbrandy') self.assertEqual(naam.guess_normal_form(), 'Gerbrandy, Jelle') self.assertEqual(naam.guess_normal_form2(), 'Jelle Gerbrandy') naam = Name('Jelle Gerbrandy') self.assertEqual(naam.guess_normal_form(), 'Gerbrandy, Jelle') naam.guess_geslachtsnaam() self.assertEqual(naam.guess_normal_form2(), 'Jelle Gerbrandy') naam = Name('Gerbrandy, Jelle') self.assertEqual(naam.guess_normal_form(), 'Gerbrandy, Jelle') self.assertEqual(naam.guess_normal_form2(), 'Jelle Gerbrandy') naam = Name(voornaam='Hendrik IV') self.assertEqual(naam.geslachtsnaam(), '') self.assertEqual(naam.guess_normal_form(), 'Hendrik IV') self.assertEqual(naam.guess_normal_form2(), 'Hendrik IV') n = Name().from_string("""<persName> <name type="voornaam">Hendrik IV</name> </persName>""") n.guess_geslachtsnaam() assert not n.geslachtsnaam(), n.to_string() self.assertEqual(n.guess_normal_form(), 'Hendrik IV') self.assertEqual(naam.guess_normal_form2(), 'Hendrik IV') s = """<persName> <name type="geslachtsnaam">Xerxes</name> </persName>""" n = Name().from_string(s) self.assertEqual(n.guess_normal_form(), 'Xerxes') s = '<persName><name type="geslachtsnaam">A</name>, Arien</persName>' n = Name().from_string(s) self.assertEqual(n.guess_normal_form(), 'A, Arien') self.assertEqual(n.guess_normal_form2(), 'Arien A') n = Name('A.B.J.Teulings') self.assertEqual(n.guess_normal_form(), 'Teulings, A.B.J.') self.assertEqual(n.guess_normal_form2(), 'A.B.J.Teulings') naam = Name('JOHAN (Johann) VII') self.assertEqual(naam.guess_normal_form(), 'Johan VII') naam = Name().from_string( '<persName><name type="geslachtsnaam">Dirk</name>, VI, Theodericus</persName>' ) self.assertEqual(naam.guess_normal_form(), 'Dirk, VI, Theodericus') naam = Name('Lodewijk XVIII') self.assertEqual(naam.guess_normal_form2(), 'Lodewijk XVIII') s = """<persName> <name type="voornaam">Trijn</name> <name type="intrapositie">van</name> <name type="geslachtsnaam">Leemput</name></persName>""" naam = Name().from_string(s) self.assertEqual(naam.guess_normal_form(), 'Leemput, Trijn van') self.assertEqual(naam.guess_normal_form2(), 'Trijn van Leemput') n5 = Name('Piet Gerbrandy', geslachtsnaam='Gerbrandy') self.assertEqual(n5.guess_normal_form(), 'Gerbrandy, Piet') self.assertEqual(n5.guess_normal_form2(), 'Piet Gerbrandy') # n6 = Name('Piet Gerbrandy', geslachtsnaam='Piet') # n6._tokenize() # self.assertEqual(n6.guess_normal_form(), 'Piet Gerbrandy') # self.assertEqual(n6.guess_normal_form2(), 'Gerbrandy Piet') n = Name('Hermansz') self.assertEqual(n.guess_normal_form(), 'Hermansz') self.assertEqual(n.geslachtsnaam(), 'Hermansz') n = Name('Ada, van Holland (1)') self.assertEqual(n.guess_normal_form(), 'Ada, van Holland') n = Name('Hees - B.P. van') self.assertEqual(n.guess_normal_form(), 'Hees - B.P. van') n = Name('Hees - B.P. van (1234-1235)') self.assertEqual(n.guess_normal_form(), 'Hees - B.P. van') n = Name('Hoeven, Abraham des Amorie van der (1)') self.assertEqual(n.guess_normal_form(), 'Hoeven, Abraham des Amorie van der') self.assertEqual(n.guess_normal_form2(), 'Abraham des Amorie van der Hoeven') n = Name('Schepper, Gerhard Antoni IJssel de') self.assertEqual(n.guess_normal_form(), 'Schepper, Gerhard Antoni IJssel de')