#DISCRETIZACION: agrupa datos para reducir su variabilidad porque los resultados de la clase son muy variados from sklearn.preprocessing import KBinsDiscretizer #El número de contenedores a producir #Método utilizado para codificar el resultado transformado: #Kmeans: la discretización se basa en los centroides de un procedimiento de agrupación de KMeans. class_discr = KBinsDiscretizer(n_bins=5, encode='ordinal', strategy="kmeans").fit_transform(data[['clase' ]]) #Tipo de Dato DataFrame class_discr = pd.DataFrame(class_discr) #Discretiza la columna MYCT para conseguir conjuntos de valores class_discr = class_discr.rename(columns={6: 'clase'}) #sobreescribimos la columna clase con los datos discretizados data[['clase']] = class_discr print(data) """ #NORMALIZACION #La normalización es el proceso de escalar muestras individuales #para tener una norma unitaria. #Este proceso puede ser útil si planea utilizar una forma cuadrática #como el producto punto o cualquier otro núcleo para cuantificar #la similitud de cualquier par de muestras. from sklearn import preprocessing matriz_normal = preprocessing.normalize(modelo)
dGraficar['PRODUCCION'] = pd.to_numeric(dGraficar['PRODUCCION']) dGraficar['AREA SEMBRADA'] = pd.to_numeric(dGraficar['AREA SEMBRADA']) dGraficar['COD_DEP'] = pd.to_numeric(dGraficar['COD_DEP']) dGraficar['AREA COSECHADA'] = pd.to_numeric(dGraficar['AREA COSECHADA']) dGraficar['RENDIMIENTO'] = pd.to_numeric(dGraficar['RENDIMIENTO']) #Luego utilizamos la función replace para realizar el cambio datosFinales['CULTIVO'].replace(to_replace = ['MAIZ','ARROZ','CAFE'], value =[0,1,2], inplace=True) datosFinales['CICLO CULTIVO'].replace(to_replace = ['ANUAL','PERMANENTE','TRANSITORIO'], value =[0,1,2], inplace=True) from sklearn.preprocessing import KBinsDiscretizer Produccion_dis = KBinsDiscretizer(n_bins=5, encode='ordinal',strategy = "kmeans").fit_transform(datosFinales[['PRODUCCION']]) Produccion_dis = pd.DataFrame(Produccion_dis) Produccion_dis = Produccion_dis.rename(columns = {0: 'PRODUCCION'}) datosFinales[['PRODUCCION']] = Produccion_dis #Defino mis variables de entrenamiento X = datosFinales[['COD_DEP','CULTIVO','AREA SEMBRADA','AREA COSECHADA']] y = datosFinales['PRODUCCION'] app = Flask(__name__) @app.route('/') def home(): return render_template('modelo.html') @app.route('/procesamiento')