def main(visitas_com_conversao, saida, data_inicial, data_final, departamentos, scaler=None): departamentos_lista = [ departamento.strip() for departamento in departamentos.split(",") ] print(departamentos_lista) result = prepare_dataframe(departamentos_lista, visitas_com_conversao, data_inicial, data_final) # Faz a escala dos valores if scaler in LIST_SCALER.keys(): result = transform(result, LIST_SCALER[scaler]) saida = os.path.join(saida, scaler) print(f"Scaling with {scaler}") # salva resultado save_partitioned(result, saida, ['data', 'hora']) print(f'saved ok') elif scaler is None: result = prepare_features(result) saida = os.path.join(saida, "sem_normalizar") print(f"Preparing data without scaling") # salva resultado save_partitioned(result, saida, ['data', 'hora']) print(f'saved ok') else: print(f"Error: Input correct key or None for original data")
def main(visitas_com_conversao, saida, data_inicial, data_final, departamentos): departamentos_lista = [ departamento.strip() for departamento in departamentos.split(",") ] result = prepare_dataframe(departamentos_lista, visitas_com_conversao, data_inicial, data_final) # Faz a escala dos valores result_scaled = transform(result, Normalizer()) # salva resultado save_partitioned(result_scaled, saida, ['data', 'hora'])
def main(visitas_com_conversao, saida, data_inicial, data_final, departamentos): if departamentos.lower() == "all": departamentos_lista = get_departamentos_all() else: departamentos_lista = [departamento.strip() for departamento in departamentos.split(",")] result = prepare_dataframe(departamentos_lista, visitas_com_conversao, data_inicial, data_final) # Faz a escala dos valores result = transform(result, MinMaxScaler()) # salva resultado numa nova pasta saida = os.path.join(saida, "min_max_scaler") os.mkdir(saida) save_partitioned(result, saida, ['data', 'hora'])