Ejemplo n.º 1
0
    def homewort_query(self):
        get_rows = self.data.map(lambda row: (row[2], float(row[11]),
                                              float(row[12]), float(row[13])))

        filter = get_rows.filter(lambda x: (x[0].lower()=='baby food') or \
                                           (x[0].lower() == 'cereal') or \
                                           (x[0].lower() == 'fruits') or \
                                           (x[0].lower() == 'meat') or \
                                           (x[0].lower() == 'vegetables') or \
                                           (x[0].lower() == 'beverages') or \
                                           (x[0].lower() == 'snacks') )

        renueve = filter.map(lambda x: (x[0], x[1])).reduceByKey(
            lambda x, y: x + y)
        costo = filter.map(lambda x: (x[0], x[2])).reduceByKey(
            lambda x, y: x + y)
        profit = filter.map(lambda x: (x[0], x[3])).reduceByKey(
            lambda x, y: x + y)

        xxx = get_ejex_ejey(renueve)
        print(str(xxx[0]))
        print(str(xxx[1]))

        strring = graph_js_apilda('renueve', str(xxx[0]), str(xxx[1]), 'bar',
                                  'x', 'y', '1')

        xxx = get_ejex_ejey(costo)
        print(str(xxx[0]))
        print(str(xxx[1]))

        strring += graph_js_apilda('costo', str(xxx[0]), str(xxx[1]), 'bar',
                                   'x', 'y', '2')

        xxx = get_ejex_ejey(profit)
        print(str(xxx[0]))
        print(str(xxx[1]))

        strring += graph_js_apilda('profit', str(xxx[0]), str(xxx[1]), 'bar',
                                   'x', 'y', '3')

        write_js_tarea('tarea_reporte', strring)
        write_html("tarea_reporte", "Tarea")
Ejemplo n.º 2
0
    def first_query(self):

        get_rows = self.data.map(lambda row: (row[0], float(row[13])))
        total = get_rows.reduceByKey(lambda x, y: x + y)
        print("primera consulta archivo 2")
        #print(get_rows.collect())
        print(total.collect())

        xxx = get_ejex_ejey(total)
        print(str(xxx[0]))
        print(str(xxx[1]))

        graph_js("archivo2_reporte1", str(xxx[0]), str(xxx[1]), 'pie',
                 'labels', 'values')
        write_html("archivo2_reporte1", "Ingresos de todas las regiones")
    def first_query(self):
        get_rows = self.data.map(lambda row: (row[3], 1))

        total_race = get_rows.reduceByKey(lambda x, y: x + y)

        total_sort = total_race.sortBy(lambda row: row[1], ascending=False)

        print("primera consulta archivo 3")
        print(total_sort.collect()[:3])

        xxx = get_ejex_ejey(total_sort)
        print(str(xxx[0][:3]))
        print(str(xxx[1][:3]))

        graph_js("archivo3_reporte1", str(xxx[0][:3]), str(xxx[1][:3]), 'bar')
        write_html("archivo3_reporte1", "Top de razas victimas")
Ejemplo n.º 4
0
    def third_query(self):

        get_rows = self.data.map(lambda row: (row[2], 1))

        total = get_rows.reduceByKey(lambda x, y: x + y)

        total_ordenado = total.sortBy(lambda row: row[1], ascending=False)

        print("tercera consulta archivo 2")
        #print(get_rows.collect())
        print(total_ordenado.collect()[0:5])

        xxx = get_ejex_ejey(total_ordenado)
        print(str(xxx[0][:5]))
        print(str(xxx[1][:5]))

        graph_js("archivo1_reporte3", str(xxx[0][:5]), str(xxx[1][:5]), 'bar')
        write_html("archivo1_reporte3",
                   "Top 5 de plataformas con mas lanzamientos")
Ejemplo n.º 5
0
    def second_query(self):

        get_rows = self.data.map(lambda row: (row[5], row[4], 1))

        rows_nintendo = get_rows.filter(
            lambda row: row[0].lower() == "nintendo")

        rows_final = rows_nintendo.map(lambda row: (row[1], row[2]))

        total = rows_final.reduceByKey(lambda x, y: x + y)

        print("segunda consulta archivo 2")
        #print(rows_nintendo.collect())
        print(total.collect())
        xxx = get_ejex_ejey(total)
        print(str(xxx[0]))
        print(str(xxx[1]))

        graph_js("archivo1_reporte2", str(xxx[0]), str(xxx[1]), 'pie',
                 'labels', 'values')
        write_html("archivo1_reporte2",
                   "Total de generos publicados por nintendo")
Ejemplo n.º 6
0
    def third_query(self):

        get_rows = self.data.map(
            lambda row: (row[5].split("/")[2], row[0], float(row[13]), row[3]))
        year2010 = get_rows.filter(
            lambda row: row[0] == "2010" and row[3].lower() == "online")

        total = year2010.map(lambda row: (row[1], row[2])).reduceByKey(
            lambda x, y: x + y)
        total_ordenado = total.sortBy(lambda row: row[1], ascending=False)

        print("tercera consulta archivo 2")
        #print(get_rows.collect())
        #print(year2010.collect())
        #print(total.collect())
        print(total_ordenado.collect())

        xxx = get_ejex_ejey(total_ordenado)
        print(str(xxx[0]))
        print(str(xxx[1]))

        graph_js("archivo2_reporte3", str(xxx[0]), str(xxx[1]), 'bar')
        write_html("archivo2_reporte3", "Año 2010 ventas online x region")
Ejemplo n.º 7
0
    def second_query(self):
        #use la orden
        get_rows = self.data.map(lambda row: (row[1], row[5].split("/")[2], int(row[8]))) \
            .filter(lambda row: row[0].lower() == 'guatemala')

        total = get_rows.map(lambda row: (row[1] + "x", row[2])).reduceByKey(
            lambda x, y: x + y)

        orden = total.sortBy(lambda row: row[1], ascending=False)

        #ventas_anio = get_rows.filter(lambda row: row[1]=="2019")
        #GUATEMLA
        print("segunda consulta archivo 2")
        #print(get_rows.collect())
        #print(total.collect())
        print(orden.collect())

        xxx = get_ejex_ejey(orden)
        print(str(xxx[0]))
        print(str(xxx[1]))

        graph_js("archivo2_reporte2", str(xxx[0]), str(xxx[1]), 'bar')
        write_html("archivo2_reporte2", "Año con mas unidades venididas")
Ejemplo n.º 8
0
    def first_query(self):

        get_rows = self.data.map(lambda row: (row[4], float(row[10])))

        genre_filters= get_rows.filter( lambda row:  (row[0].lower() == "action") \
                                        or (row[0].lower() == "sports") \
                                        or (row[0].lower() == "fighting") \
                                        or (row[0].lower() == "shooter") \
                                        or (row[0].lower() == "racing") \
                                        or (row[0].lower() == "adventure") \
                                        or (row[0].lower() == "strategy") )

        total = genre_filters.reduceByKey(lambda x, y: x + y)

        #print(genre_filters.collect())
        print(total.collect())

        xxx = get_ejex_ejey(total)
        print(str(xxx[0]))
        print(str(xxx[1]))

        graph_js("archivo1_reporte1", str(xxx[0]), str(xxx[1]), 'bar')
        write_html("archivo1_reporte1", "Ventas globales de la sig categorias")