def test_strip_acents(self): text = ReTexto('perú') assert_true(text.strip_accents().text == 'peru')
.remove_multispaces() \ .remove_punctuation(by=' ') \ .convert_emoji() \ .remove_nochars(preserve_tilde=True) \ .remove_stopwords() \ .split_words() print(s) s = 'San Juan de Lurigancho ¿Por qué es una mala idea destruir un complejo \ verde y deportivo para levantar un hospital? El barrio Enrique \ Montenegro en San Juan de Lurigancho (SJL) sin dinero' text = ReTexto(s) s = text.remove_html() \ .lower() \ .remove_nochars(preserve_tilde=True) \ .remove_stopwords() \ .split_words() print(s) s = 'Que buen Año! mi PerÚ' text = ReTexto(s) s = text.remove_html() \ .lower() \ .remove_nochars(preserve_tilde=True) \ .remove_stopwords() print(s.text) s = 'Cantó, señalÓ, Mirá, Pí' text = ReTexto(s) s = text.strip_accents() print(s.text)