def test_parse_es_def_semicolon(self): parser = make_es_definitions_parser() text = """ Me gusta tocar la guitarra. "El ser humano": una anatomía moderna humana. Me gusta cantar el sol""" ret = parser.parse(text) assert len(ret) == 1 name = ret[0]["tags"]["Extracted Entity Definition Name"] self.assertEqual("El ser humano", name.strip('"'))
def test_acronym(self): text = "rompió el silencio tras ser despedido del Canal del Fútbol (CDF). " parser = make_es_definitions_parser() #ret = parser.parse(text) #self.assertEqual(1, len(ret)) text = "rompió el silencio tras ser despedido del Canal del Fútbol (cdf). " ret = parser.parse(text) self.assertEqual(0, len(ret)) text = "rompió el silencio tras ser despedido del Canal del Fútbol (F). " ret = parser.parse(text) self.assertEqual(0, len(ret)) text = "Pico della Mirandola (PDM)" ret = parser.parse(text) self.assertEqual(1, len(ret)) text = "Pico Della Mirandola (PDM)" ret = parser.parse(text) self.assertEqual(1, len(ret)) text = "pico della Mirandola (PDM)" ret = parser.parse(text) self.assertEqual(0, len(ret)) text = "Pico della Mirandola (PM)" ret = parser.parse(text) self.assertEqual(1, len(ret)) text = "Pico Della Mirandola (PM)" ret = parser.parse(text) self.assertEqual(1, len(ret)) text = "Pico della questo quello Mirandola (PDM)" ret = parser.parse(text) self.assertEqual(0, len(ret)) text = "Pico Pico della Mirandola (PPdM)" ret = parser.parse(text) self.assertEqual(1, len(ret)) text = "Pico Pico della Mirandola (PpdM)" ret = parser.parse(text) self.assertEqual(1, len(ret)) text = "Pico Pico della Mirandola (Ppdm)" ret = parser.parse(text) self.assertEqual(0, len(ret))
def test_parse_de_definitions_simple(self): parser = make_es_definitions_parser() text = load_resource_document('lexnlp/extract/es/definitions/eula.txt', 'utf-8') ret = parser.parse(text) self.assertGreater(len(ret), 4) annotate_definitions_text(text, ret, 'output/es_definitions_01.html')
def test_grab_just_quoted_words(self): parser = make_es_definitions_parser() text = """(en adelante, "ESET" o "el Proveedor") y usted""" ret = parser.parse(text) assert len(ret) == 2