예제 #1
0
def probar_algoritmo_scikit_data(k):

    digits = datasets.load_digits()

    x_digits = digits.data
    y_digits = digits.target

    n_samples = len(x_digits)

    train_dataset = x_digits[:.9 * n_samples]
    train_labels = y_digits[:.9 * n_samples]
    test_dataset = x_digits[.9 * n_samples:]
    test_labels = y_digits[.9 * n_samples:]

    errores = 0

    i = 0

    for test_instance in test_dataset:

        etiqueta_real = test_labels[i]

        i += 1

        predicted_label = clasificar(test_instance, train_dataset,
                                     train_labels, k)

        if etiqueta_real != predicted_label:
            errores += 1

        print "Clasificando instancia. Etiqueta real: %s - etiqueta predicha: %s" % (
            etiqueta_real, predicted_label)

    print 'Total de errores: %s - Procentaje de error: %s' % (
        errores, float(errores) / len(test_dataset))
예제 #2
0
def probar_algoritmo_scikit_data(k):

    digits = datasets.load_digits()

    x_digits = digits.data
    y_digits = digits.target

    n_samples = len(x_digits)

    train_dataset = x_digits[: 0.9 * n_samples]
    train_labels = y_digits[: 0.9 * n_samples]
    test_dataset = x_digits[0.9 * n_samples :]
    test_labels = y_digits[0.9 * n_samples :]

    errores = 0

    i = 0

    for test_instance in test_dataset:

        etiqueta_real = test_labels[i]

        i += 1

        predicted_label = clasificar(test_instance, train_dataset, train_labels, k)

        if etiqueta_real != predicted_label:
            errores += 1

        print "Clasificando instancia. Etiqueta real: %s - etiqueta predicha: %s" % (etiqueta_real, predicted_label)

    print "Total de errores: %s - Procentaje de error: %s" % (errores, float(errores) / len(test_dataset))
예제 #3
0
def probar_algoritmo(training_dataset_path, test_dataset_path, k):
    etiquetas, contenidos = leer_training_set(training_dataset_path)

    archivos = os.listdir(test_dataset_path)

    errores = 0

    for filename in archivos:
        # print 'Procesando: %s/%s' % (dir_path, filename)
        partes = filename.split('_')
        etiqueta_real = partes[0]

        test_instance = convertir_imagen("%s/%s" % (test_dataset_path, filename))
        predicted_label = clasificar(test_instance, contenidos, etiquetas, k)

        if etiqueta_real != predicted_label:
            errores += 1

        print "Clasificando archivo: %s. Etiqueta real: %s - etiqueta predicha: %s" % (filename,
                                                                                       etiqueta_real,
                                                                                       predicted_label)

    print 'Total de errores: %s - Procentaje de error: %s' % (errores, float(errores) / len(archivos))