Пример #1
0
 def test_strip_acents(self):
     text = ReTexto('perú')
     assert_true(text.strip_accents().text == 'peru')
Пример #2
0
            .remove_multispaces() \
            .remove_punctuation(by=' ') \
            .convert_emoji() \
            .remove_nochars(preserve_tilde=True) \
            .remove_stopwords() \
            .split_words()
    print(s)
    s = 'San Juan de Lurigancho ¿Por qué es una mala idea destruir un complejo \
        verde y deportivo para levantar un hospital? El barrio Enrique \
        Montenegro en San Juan de Lurigancho (SJL) sin dinero'

    text = ReTexto(s)
    s = text.remove_html() \
            .lower() \
            .remove_nochars(preserve_tilde=True) \
            .remove_stopwords() \
            .split_words()
    print(s)
    s = 'Que buen Año! mi PerÚ'
    text = ReTexto(s)
    s = text.remove_html() \
            .lower() \
            .remove_nochars(preserve_tilde=True) \
            .remove_stopwords()

    print(s.text)
    s = 'Cantó, señalÓ, Mirá, Pí'
    text = ReTexto(s)
    s = text.strip_accents()
    print(s.text)