Ejemplos de DataLoader.read_data en Python

Lenguaje de programación: Python

Namespace/Package Name: data.DataLoader

Clase / Tipo: DataLoader

Método / Función: read_data

Ejemplos en hotexamples.com: 1

Python DataLoader.read_data - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de data.DataLoader.DataLoader.read_data extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

DataLoader(10)

read(7)

loadData(5)

load(2)

applyVectorizers(1)

datasource(1)

getLabels(1)

read_data(1)

read_paths(1)

train_generator(1)

validation_generator(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: DataAnalysis.py Proyecto: nikolaosmparoutis/Book_Recommendation_System

def main():
    paths = "/home/nikoscf/PycharmProjects/BookRecommendation/configurations/paths.yml"
    load_begin = DataLoader()
    load_begin.read_paths(paths)

    # Uncomment to Execute this one time to get the zip if is .zip, unzip it in absolute dir you set in paths.yaml
    # Then it checks for .csv and remove the redundant zip folder
    # load_begin.check_zip_and_csv()

    books = load_begin.read_data("BX-Books.csv")
    users = load_begin.read_data("BX-Users.csv")
    ratings = load_begin.read_data("BX-Book-Ratings.csv")

    to_drop_columns = ['Image-URL-S', 'Image-URL-M', 'Image-URL-L']
    numeric_col_to_nan = ["Year-Of-Publication"]
    data_books = DataClean(books)
    clean_books = data_books.execute_pipeline_cleaning(to_drop_columns,
                                                       numeric_col_to_nan)

    to_drop_columns = []
    numeric_col_to_nan = ["User-ID", "Age"]
    data_users = DataClean(users)
    clean_users = data_users.execute_pipeline_cleaning(to_drop_columns,
                                                       numeric_col_to_nan)

    to_drop_columns = []
    numeric_col_to_nan = ["User-ID", "ISBN", "Book-Rating"]
    data_ratings = DataClean(ratings)
    clean_ratings = data_ratings.execute_pipeline_cleaning(
        to_drop_columns, numeric_col_to_nan)

    data_analysis = DataAnalysis()
    ratings_pivoted = data_analysis.execute_pipeline_data_analysis(
        clean_ratings, clean_users, clean_books)
    return ratings_pivoted