#Avaliação
Os exercícios foram realizados no databricks.
instalei a lib spark-xml_2.11-0.5.0.jar para conseguir gerar o xml.
Link do dataset: http://www.portaltransparencia.gov.br/download-de-dados/viagens
- Ler CSV Viagens e gerar output Parquet
- Ler CSV Viagens e gerar output XML
- Ler CSV Viagens, ordenar por nome do órgão superior e nome do órgão solicitante em ordem decrescente. Gerar JSON do resultado.
- Ler CSV Viagens e criar coluna "Valor Total" (Valor diária + Valor Passagens + Valor Outros)
- Ler CSV e apresentar o total gasto por orgao solicitante onde a Situação for igual a Realizada (utilizar a coluna valor total que foi criada no item 4)
- Ler CSV de viagens e de trechos. Selecionar os campos Id do processo de viagem, situação, nome do órgão superior, sequência trecho, destino - cidade. Salvar um JSON de outpout