def probar_algoritmo_scikit_data(k): digits = datasets.load_digits() x_digits = digits.data y_digits = digits.target n_samples = len(x_digits) train_dataset = x_digits[:.9 * n_samples] train_labels = y_digits[:.9 * n_samples] test_dataset = x_digits[.9 * n_samples:] test_labels = y_digits[.9 * n_samples:] errores = 0 i = 0 for test_instance in test_dataset: etiqueta_real = test_labels[i] i += 1 predicted_label = clasificar(test_instance, train_dataset, train_labels, k) if etiqueta_real != predicted_label: errores += 1 print "Clasificando instancia. Etiqueta real: %s - etiqueta predicha: %s" % ( etiqueta_real, predicted_label) print 'Total de errores: %s - Procentaje de error: %s' % ( errores, float(errores) / len(test_dataset))
def probar_algoritmo_scikit_data(k): digits = datasets.load_digits() x_digits = digits.data y_digits = digits.target n_samples = len(x_digits) train_dataset = x_digits[: 0.9 * n_samples] train_labels = y_digits[: 0.9 * n_samples] test_dataset = x_digits[0.9 * n_samples :] test_labels = y_digits[0.9 * n_samples :] errores = 0 i = 0 for test_instance in test_dataset: etiqueta_real = test_labels[i] i += 1 predicted_label = clasificar(test_instance, train_dataset, train_labels, k) if etiqueta_real != predicted_label: errores += 1 print "Clasificando instancia. Etiqueta real: %s - etiqueta predicha: %s" % (etiqueta_real, predicted_label) print "Total de errores: %s - Procentaje de error: %s" % (errores, float(errores) / len(test_dataset))
def probar_algoritmo(training_dataset_path, test_dataset_path, k): etiquetas, contenidos = leer_training_set(training_dataset_path) archivos = os.listdir(test_dataset_path) errores = 0 for filename in archivos: # print 'Procesando: %s/%s' % (dir_path, filename) partes = filename.split('_') etiqueta_real = partes[0] test_instance = convertir_imagen("%s/%s" % (test_dataset_path, filename)) predicted_label = clasificar(test_instance, contenidos, etiquetas, k) if etiqueta_real != predicted_label: errores += 1 print "Clasificando archivo: %s. Etiqueta real: %s - etiqueta predicha: %s" % (filename, etiqueta_real, predicted_label) print 'Total de errores: %s - Procentaje de error: %s' % (errores, float(errores) / len(archivos))