Ejemplo n.º 1
0
def main(visitas_com_conversao,
         saida,
         data_inicial,
         data_final,
         departamentos,
         scaler=None):

    departamentos_lista = [
        departamento.strip() for departamento in departamentos.split(",")
    ]
    print(departamentos_lista)
    result = prepare_dataframe(departamentos_lista, visitas_com_conversao,
                               data_inicial, data_final)

    # Faz a escala dos valores
    if scaler in LIST_SCALER.keys():
        result = transform(result, LIST_SCALER[scaler])
        saida = os.path.join(saida, scaler)
        print(f"Scaling with {scaler}")

        # salva resultado
        save_partitioned(result, saida, ['data', 'hora'])
        print(f'saved ok')
    elif scaler is None:
        result = prepare_features(result)
        saida = os.path.join(saida, "sem_normalizar")
        print(f"Preparing data without scaling")

        # salva resultado
        save_partitioned(result, saida, ['data', 'hora'])
        print(f'saved ok')
    else:
        print(f"Error: Input correct key or None for original data")
Ejemplo n.º 2
0
def main(visitas_com_conversao, saida, data_inicial, data_final,
         departamentos):
    departamentos_lista = [
        departamento.strip() for departamento in departamentos.split(",")
    ]

    result = prepare_dataframe(departamentos_lista, visitas_com_conversao,
                               data_inicial, data_final)

    # Faz a escala dos valores
    result_scaled = transform(result, Normalizer())

    # salva resultado
    save_partitioned(result_scaled, saida, ['data', 'hora'])
Ejemplo n.º 3
0
def main(visitas_com_conversao, saida, data_inicial, data_final, departamentos):
    if departamentos.lower() == "all":
        departamentos_lista = get_departamentos_all()
    else:
        departamentos_lista = [departamento.strip() for departamento in departamentos.split(",")]

    result = prepare_dataframe(departamentos_lista, visitas_com_conversao, data_inicial, data_final)

    # Faz a escala dos valores
    result = transform(result, MinMaxScaler())

    # salva resultado numa nova pasta
    saida = os.path.join(saida, "min_max_scaler")
    os.mkdir(saida)
    save_partitioned(result, saida, ['data', 'hora'])