示例#1
0
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import matplotlib.pyplot as plt
import seaborn as sns

from time import time
from acctransito_utiles import titulo, cargarArchivo, filtro, filtro2


titulo("Inicio Ingesta")
df = cargarArchivo()
titulo("Fin Ingesta")

titulo("Eliminando posibles faltantes")
df.dropna(subset=['Start_Lat', 'Start_Lng'])

print("Longitud",len(df))

titulo("Inicio Procesamiento")
inicio = time()
Lista=[]
for h in df.index:
    if filtro2(df['Start_Lng'][h], df['Start_Lat'][h]):
        Lista.append([df['Start_Lat'][h],df['Start_Lng'][h]])            
    
fin = time()

duracion= fin-inicio
titulo("Calculado en:")
print(duracion)
titulo("Puntos Hallados")
示例#2
0
from time import time
from acctransito_utiles import titulo, cargarArchivo

df = cargarArchivo()

inicio = time()
media = df['Distance(mi)'].mean()
fin = time()
duracion = fin - inicio
titulo("Media")
print(media)
titulo("Calculado en:")
print(duracion)
示例#3
0
from acctransito_utiles import titulo, cargarArchivo
import matplotlib.pyplot as plt
import pandas as pd

df = cargarArchivo()

titulo('Analisis')
titulo('Atributos del Archivo US_Accidents_Dec19.csv')
campos = df.columns.values
print(campos)

titulo('Info de US_Accidents_Dec19.csv')
print(df.info())

titulo('Resumen Atributos Numéricos')
print(df.describe())

titulo('Resumen Atributos Nominales')
print(df.describe(include=['O']))

campos_numericos = [
    key for key in dict(df.dtypes)
    if dict(df.dtypes)[key] in ['float64', 'int64']
]
campos_nominales = [
    key for key in dict(df.dtypes)
    if dict(df.dtypes)[key] not in ['float64', 'int64']
]

for i in campos_numericos:
    titulo('Nombre:' + i)
示例#4
0
from acctransito_utiles import titulo, cargarArchivo
from time import time

titulo("Inicio Ingesta")
df = cargarArchivo()
titulo("Fin Ingesta")

titulo('Accidentes entre fechas')
inicio = time()
filtro = (df['Start_Time'] > '2016-02-08 08:46:00') & (df['Start_Time'] <=
                                                       '2018-10-10 08:46:00')
df_ef = df.loc[filtro]
print(df_ef)
fin = time()
duracion = fin - inicio
titulo("Calculado en:")
print(duracion)
from acctransito_utiles import titulo, cargarArchivo
from time import time

titulo("Inicio Ingesta")
df = cargarArchivo()
titulo("Fin Ingesta")

df['util'] = 0
titulo('Ciudades mas Peligrosas')
inicio = time()
df_agrupado = df[['City', 'util']].groupby(
    ['City'], as_index=False).count().sort_values(by='util', ascending=False)
print(df_agrupado)
fin = time()
duracion1 = fin - inicio
titulo("City Calculado en:")
print(duracion1)

titulo('Weather_Condition mas Peligrosas')
inicio = time()
df_agrupado = df[['Weather_Condition', 'util']].groupby(
    ['Weather_Condition'], as_index=False).count().sort_values(by='util',
                                                               ascending=False)
print(df_agrupado)
fin = time()
duracion2 = fin - inicio
titulo("Weather_Condition Calculado en:")
print(duracion2)

titulo('State mas Peligrosas')
inicio = time()