import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) import matplotlib.pyplot as plt import seaborn as sns from time import time from acctransito_utiles import titulo, cargarArchivo, filtro, filtro2 titulo("Inicio Ingesta") df = cargarArchivo() titulo("Fin Ingesta") titulo("Eliminando posibles faltantes") df.dropna(subset=['Start_Lat', 'Start_Lng']) print("Longitud",len(df)) titulo("Inicio Procesamiento") inicio = time() Lista=[] for h in df.index: if filtro2(df['Start_Lng'][h], df['Start_Lat'][h]): Lista.append([df['Start_Lat'][h],df['Start_Lng'][h]]) fin = time() duracion= fin-inicio titulo("Calculado en:") print(duracion) titulo("Puntos Hallados")
from time import time from acctransito_utiles import titulo, cargarArchivo df = cargarArchivo() inicio = time() media = df['Distance(mi)'].mean() fin = time() duracion = fin - inicio titulo("Media") print(media) titulo("Calculado en:") print(duracion)
from acctransito_utiles import titulo, cargarArchivo import matplotlib.pyplot as plt import pandas as pd df = cargarArchivo() titulo('Analisis') titulo('Atributos del Archivo US_Accidents_Dec19.csv') campos = df.columns.values print(campos) titulo('Info de US_Accidents_Dec19.csv') print(df.info()) titulo('Resumen Atributos Numéricos') print(df.describe()) titulo('Resumen Atributos Nominales') print(df.describe(include=['O'])) campos_numericos = [ key for key in dict(df.dtypes) if dict(df.dtypes)[key] in ['float64', 'int64'] ] campos_nominales = [ key for key in dict(df.dtypes) if dict(df.dtypes)[key] not in ['float64', 'int64'] ] for i in campos_numericos: titulo('Nombre:' + i)
from acctransito_utiles import titulo, cargarArchivo from time import time titulo("Inicio Ingesta") df = cargarArchivo() titulo("Fin Ingesta") titulo('Accidentes entre fechas') inicio = time() filtro = (df['Start_Time'] > '2016-02-08 08:46:00') & (df['Start_Time'] <= '2018-10-10 08:46:00') df_ef = df.loc[filtro] print(df_ef) fin = time() duracion = fin - inicio titulo("Calculado en:") print(duracion)
from acctransito_utiles import titulo, cargarArchivo from time import time titulo("Inicio Ingesta") df = cargarArchivo() titulo("Fin Ingesta") df['util'] = 0 titulo('Ciudades mas Peligrosas') inicio = time() df_agrupado = df[['City', 'util']].groupby( ['City'], as_index=False).count().sort_values(by='util', ascending=False) print(df_agrupado) fin = time() duracion1 = fin - inicio titulo("City Calculado en:") print(duracion1) titulo('Weather_Condition mas Peligrosas') inicio = time() df_agrupado = df[['Weather_Condition', 'util']].groupby( ['Weather_Condition'], as_index=False).count().sort_values(by='util', ascending=False) print(df_agrupado) fin = time() duracion2 = fin - inicio titulo("Weather_Condition Calculado en:") print(duracion2) titulo('State mas Peligrosas') inicio = time()