def clean_file(input_path, output_path): """Limpia los datos del input creando un nuevo archivo limpio.""" print("Comenzando limpieza...") dc = DataCleaner(input_path, encoding='latin1') custom_cleaning_before_rules(dc) dc.clean(RULES) custom_cleaning_after_rules(dc) y = 2015 dc.df.hasta = pd.to_datetime(dc.df.hasta, yearfirst=True) dc.df.desde = pd.to_datetime(dc.df.desde, yearfirst=True) gii = dc.df.desde.dt.year == y gif = dc.df.hasta.dt.year == y gis = (dc.df.desde.dt.year < y) & (dc.df.hasta.dt.year > y) givig = gii | gif | gis df1 = dc.df[givig].copy() print("La cantida de registros 2015 es: ") print(givig.sum()) gin2016 = dc.df.desde.dt.year == 2016 df2 = dc.df[~gin2016].copy() print("La cantida de registros historicos es: ") print((~gin2016).sum()) df1.to_csv( DEFAULT_OUTPUT_PATH_VIGENTE, encoding=dc.OUTPUT_ENCODING, separator=dc.OUTPUT_SEPARATOR, quotechar=dc.OUTPUT_QUOTECHAR, index=False) df2.to_csv( DEFAULT_OUTPUT_PATH1_HISTORICO, encoding=dc.OUTPUT_ENCODING, separator=dc.OUTPUT_SEPARATOR, quotechar=dc.OUTPUT_QUOTECHAR, index=False) print("Limpieza finalizada exitosamente!")
def clean_file(input_path, output_path): """Limpia los datos del input creando un nuevo archivo limpio.""" print("Comenzando limpieza...") dc = DataCleaner(input_path, encoding='Latin 1') custom_cleaning_before_rules(dc) dc.clean(RULES) custom_cleaning_after_rules(dc) y = 2015 dc.df.hasta = pd.to_datetime(dc.df.hasta, yearfirst=True) dc.df.desde = pd.to_datetime(dc.df.desde, yearfirst=True) gii = dc.df.desde.dt.year == y gif = dc.df.hasta.dt.year == y gis = (dc.df.desde.dt.year < y) & (dc.df.hasta.dt.year > y) givig = gii | gif | gis df1 = dc.df[givig] gin2016 = dc.df.desde.dt.year == 2016 df2 = dc.df[~gin2016] df1.set_index(df1.columns[0]).to_csv( DEFAULT_OUTPUT_PATH_VIGENTE, encoding=dc.OUTPUT_ENCODING, separator=dc.OUTPUT_SEPARATOR, quotechar=dc.OUTPUT_QUOTECHAR) df2.set_index(df2.columns[0]).to_csv( DEFAULT_OUTPUT_PATH1_HISTORICO, encoding=dc.OUTPUT_ENCODING, separator=dc.OUTPUT_SEPARATOR, quotechar=dc.OUTPUT_QUOTECHAR) print("Limpieza finalizada exitosamente!")
def clean_file(input_path, output_path): """Limpia los datos del input creando un nuevo archivo limpio.""" print("Comenzando limpieza...") dc = DataCleaner(input_path) custom_cleaning_before_rules(dc) dc.clean(RULES) custom_cleaning_after_rules(dc) dc.save(output_path) print("Limpieza finalizada exitosamente!")
def clean_file(input_path, output_path): """Limpia los datos del input creando un nuevo archivo limpio.""" print("Comenzando limpieza...") dc = DataCleaner(input_path) custom_cleaning_before_rules(dc) dc.clean(RULES) custom_cleaning_after_rules(dc) dc.save(output_path) print("Limpieza finalizada exitosamente!")
def apply_rules_to_dataset(csv_input, csv_output, dataset_file_rules, parse_options): with warnings.catch_warnings(record=True) as catched_warnings: dc = DataCleaner(csv_input, **parse_options) dc.clean(dataset_file_rules['data-cleaner-rules']) dc.df.set_index(dc.df.columns[0]).to_csv( csv_output, encoding=dc.OUTPUT_ENCODING, sep=dc.OUTPUT_SEPARATOR, quotechar=dc.OUTPUT_QUOTECHAR ) return catched_warnings