Herramienta de consola para quitar el formato molesto del texto de algunos PDFs. La idea surgió debido a la necesidad de sacar información de distintos PDFs a la hora de hacer trabajos prácticos, y que estos estén en un formato molesto y que acomodarlo en un archivo Word lleve mucho tiempo.
Ver ayuda:
$ python main.py -h
-
Input
Hay 2 formas de ingresar el texto:
-
Por consola
$ python main.py -i "Mi texto"
-
Por archivo
$ python main.py -i texto.txt
-
-
Output
Si no se proporciona este argumento se mostrará el resultado en la consola.
$ python main.py -o resultado.txt
-
Quitar justificado
$ python main.py -j
-
Quitar guiones y saltos de línea
$ python main.py -g
$ python main.py -i text.txt -o output.txt -g
Mirar los archivos:
> text.txt
> output.txt