def test1(): assert andaluh.epa('Todo Xenomorfo dice: [haber], que el Éxito y el éxtasis asfixian, si no eres un xilófono Chungo.') == u'Tó Çenomorfo diçe: [abêh], que el Éççito y el éttaçî âffîççian, çi no erê un çilófono Xungo.' assert andaluh.epa('Lleva un Guijarrito el ABuelo, ¡Qué Bueno! ¡para la VERGÜENZA!') == u'Yeba un Giharrito el AGuelo, ¡Qué Gueno! ¡pa la BERGUENÇA!' assert andaluh.epa('VALLA valla, si vas toda de ENVIDIA') == u'BAYA baya, çi bâ toa de EMBIDIA' assert andaluh.epa('Alrededor de la Alpaca había un ALfabeto ALTIVO de valkirias malnacidas') == u'Arrededôh de la Arpaca abía un ARfabeto ARTIBO de barkiriâ mânnaçidâ' assert andaluh.epa('En la Zaragoza y el Japón asexual se Sabía SÉriamente sILBAR con el COxis') == u'En la Çaragoça y er Hapón açêççuâh çe Çabía ÇÉriamente çIRBÂH con er CÔççî' assert andaluh.epa('Transportandonos a la connotación perspicaz del abstracto solsticio de Alaska, el aislante plástico adsorvente asfixió al aMnésico pseudoescritor granadino de constituciones, para ConMemorar broncas adscritas') == u'Trâpportandonô a la cônnotaçión perppicâh del âttrâtto çorttiçio de Alâkka, el aîl-lante pláttico âççorbente âffîççió al ânnéçico çeudoêccritôh granadino de côttituçionê, pa CôMMemorâh broncâ âccritâ' assert andaluh.epa('En la postmodernidad, el transcurso de los transportes y translados en postoperatorios transcienden a la postre unas postillas postpalatales apostilladas se transfieren') == u'En la pômmodênnidá, er trâccurço de lô trâpportê y trâl-láô en pôttoperatoriô trâççienden a la pôttre unâ pôttiyâ pôppalatalê apôttiyâh çe trâffieren' assert andaluh.epa('Venid todos a correr en anorak de visón a Cádiz con actitud y maldad, para escuchar el tríceps de Albéniz tocar ápud con virtud de laúd.') == u'Benîh tôh a corrêh en anorâh de biçón a Cádî con âttitûh y mardá, pa êccuxâh er tríçê de Arbénî tocâh ápû con birtûh de laûh.' assert andaluh.epa('Una comida fabada con fado, y sin descuido será casada y amarrada al acolchado roido.') == u'Una comida fabada con fado, y çin dêccuido çerá caçá y amarrá al acorxao roío.' assert andaluh.epa('Los SABuesos ChiHuaHUA comían cacaHuETes, FramBuESas y Heno, ¡y HABLAN ESPANGLISH!') == u'Lô ÇAGueçô XiGuaGUA comían cacaGuETê, FramBuEÇâ y Eno, ¡y ABLAN ÊPPANGLÎ!'
def test2(report_all=False): import csv file = "./tests/lemario_cas_and.csv" transcriptions = [] transcription_errors = [] stats = {"total": 0, "ok": 0, "fail": 0} with open(file) as fh: rd = csv.DictReader(fh, delimiter=',') for row in rd: caste = row['cas'] andal = row['and'] trans = andaluh.epa(row['cas']) if andal != trans: transcription_errors.append((caste, andal, trans)) stats["fail"] += 1 else: stats["ok"] += 1 transcriptions.append((caste, andal, trans)) stats["total"] += 1 if report_all: for error in transcription_errors: print(error[0] + " => " + error[1] + ', ' + error[2]) import pprint pprint.pprint(stats)
def transcribe(text, vaf='ç', vvf='h'): """ Transcribe input text. :param text: input text :param vaf: vaf configuration for andaluh-py :param vvf: vvf configuration for andaluh-py :return: """ try: transcription = andaluh.epa(text, vaf=vaf, vvf=vvf, escape_links=True) except Exception as e: transcription = str(text) print( f"Error in andaluh package when trying to transcript text {text}: {repr(e)}" ) return transcription
def get(self): args = parser.parse_args() spanish = args['spanish'] vaf = args['vaf'] or VAF vvf = args['vvf'] or VVF escapeLinks = True if args['escapeLinks'] in ['True', 'true' ] else False return { "spanish": spanish, "andaluh": andaluh.epa(spanish, vaf=vaf, vvf=vvf, escape_links=escapeLinks), "rules": { "vaf": vaf, "vvf": vvf, "escapeLinks": escapeLinks } }