コード例 #1
0
    def test_parse_es_def_semicolon(self):
        parser = make_es_definitions_parser()
        text = """
        Me gusta tocar la guitarra.
        "El ser humano": una anatomía moderna humana.
        Me gusta cantar el sol"""

        ret = parser.parse(text)
        assert len(ret) == 1
        name = ret[0]["tags"]["Extracted Entity Definition Name"]
        self.assertEqual("El ser humano", name.strip('"'))
コード例 #2
0
    def test_acronym(self):
        text = "rompió el silencio tras ser despedido del Canal del Fútbol (CDF). "
        parser = make_es_definitions_parser()
        #ret = parser.parse(text)
        #self.assertEqual(1, len(ret))

        text = "rompió el silencio tras ser despedido del Canal del Fútbol (cdf). "
        ret = parser.parse(text)
        self.assertEqual(0, len(ret))

        text = "rompió el silencio tras ser despedido del Canal del Fútbol (F). "
        ret = parser.parse(text)
        self.assertEqual(0, len(ret))

        text = "Pico della Mirandola (PDM)"
        ret = parser.parse(text)
        self.assertEqual(1, len(ret))

        text = "Pico Della Mirandola (PDM)"
        ret = parser.parse(text)
        self.assertEqual(1, len(ret))

        text = "pico della Mirandola (PDM)"
        ret = parser.parse(text)
        self.assertEqual(0, len(ret))

        text = "Pico della Mirandola (PM)"
        ret = parser.parse(text)
        self.assertEqual(1, len(ret))

        text = "Pico Della Mirandola (PM)"
        ret = parser.parse(text)
        self.assertEqual(1, len(ret))

        text = "Pico della questo quello Mirandola (PDM)"
        ret = parser.parse(text)
        self.assertEqual(0, len(ret))

        text = "Pico Pico della Mirandola (PPdM)"
        ret = parser.parse(text)
        self.assertEqual(1, len(ret))

        text = "Pico Pico della Mirandola (PpdM)"
        ret = parser.parse(text)
        self.assertEqual(1, len(ret))

        text = "Pico Pico della Mirandola (Ppdm)"
        ret = parser.parse(text)
        self.assertEqual(0, len(ret))
コード例 #3
0
 def test_parse_de_definitions_simple(self):
     parser = make_es_definitions_parser()
     text = load_resource_document('lexnlp/extract/es/definitions/eula.txt', 'utf-8')
     ret = parser.parse(text)
     self.assertGreater(len(ret), 4)
     annotate_definitions_text(text, ret, 'output/es_definitions_01.html')
コード例 #4
0
 def test_grab_just_quoted_words(self):
     parser = make_es_definitions_parser()
     text = """(en adelante, "ESET" o "el Proveedor") y usted"""
     ret = parser.parse(text)
     assert len(ret) == 2