main.py

import image_processing as imp
import image_operations as imo
import staff_lines as sl
import image_region_recognition as irr
import music_classification as mc
import os


def load_image(image_name):
    print("Loading image: %s" % image_name)
    return imp.load_image(image_name)


def image_gray(image):
    print("Grayscaling image...")
    return imp.image_gray(image)


def image_bin_adaptive_gauss(image, block_size):
    print("Binarizing image (Adaptive Gaussian Binarization)...")
    return imp.image_bin_adaptive_gauss(image, block_size)


def invert(image):
    print("Inverting image...")
    return imp.invert(image)


def display_image(image):
    return imp.display_image(image)


def open_image(image, kernel=None):
    return imo.open_image(image, kernel)


def open_image_vertically(staff_image, avg_staff_spacing):
    print("Opening staff image with vertical kernel...")
    return imo.open_image_vertically(staff_image, avg_staff_spacing)


def find_lines(inv_img):
    print("Finding staff lines...")
    return sl.find_lines(inv_img)


def remove_lines(inv_img, lines):
    print("Removing staff lines...")
    return sl.remove_lines(inv_img, lines)


def find_regions(org_image, ref_image=None, pixel_span=2, eight_way=True):
    return irr.find_regions(org_image, ref_image=ref_image, pixel_span=pixel_span, eight_way=eight_way)


def find_vertical_regions(staff_image, img_vert_lines, avg_staff_spacing, pixel_span=1, eight_way=True):
    print("Finding vertical regions...")
    return irr.find_vertical_regions(staff_image, img_vert_lines, avg_staff_spacing,
                                     pixel_span=pixel_span, eight_way=eight_way)


def get_bar_lines(regions, vertical_lines, staff):
    print("Classifying bar lines...")
    return mc.get_bar_lines(regions, vertical_lines, staff)


def remove_bar_lines(images, bar_lines, regions):
    print("Removing bar lines from staff images and regions...")
    return mc.remove_bar_lines(images, bar_lines, regions)


def get_clefs(image, regions, bar_lines):
    print("Classifying clefs...")
    return mc.get_clefs(image, regions, bar_lines)


def remove_clefs(images, clefs, regions):
    if len(clefs) > 0:
        print("Removing clefs from staff images and regions...")
        return mc.remove_clefs(images, clefs, regions)


def get_time_signatures(staff_image, regions, bar_lines, clefs):
    print("Classyfing time signatures...")
    return mc.get_time_signatures(staff_image, regions, bar_lines, clefs)


def remove_time_signatures(images, time_signatures, regions):
    if len(time_signatures) > 0:
        print("Removing time signatures...")
        return mc.remove_time_signatures(images, time_signatures, regions)


def get_endings(staff_image, regions, top_staff_line_row):
    print("Classyfing endings...")
    return mc.get_endings(staff_image, regions, top_staff_line_row)


def remove_endings(images, endings, regions):
    if len(endings) > 0:
        print("Removing time signatures...")
        return mc.remove_endings(images, endings, regions)


def find_vertical_notes(image, regions, staff, staff_spacing, staff_distance):
    print("Finding notes...")
    return mc.find_vertical_notes(image, regions, staff, staff_spacing, staff_distance)


def remove_vertical_notes(images, notes, regions):
    return mc.remove_vertical_notes(images, notes, regions)


def find_accidentals(image, regions):
    print("Finding accidentals...")
    return mc.find_accidentals(image, regions)


def remove_accidentals(images, accidentals, regions):
    return mc.remove_accidentals(images, accidentals, regions)


def find_dots(image, regions, staff_spacing):
    print("Finding duration dots...")
    return mc.find_dots(image, regions, staff_spacing)


def remove_dots(images, dots, regions):
    return mc.remove_duration_dots(images, [dot[0] for dot in dots], regions)


def remove_ledgers(images, regions, staff, staff_distance):
    return mc.remove_ledgers(images, regions, staff, staff_distance)


def find_whole_notes(image, regions, bar_lines, clefs, time_signatures, staff, staff_spacing, staff_distance):
    return mc.find_whole_notes(image, regions, bar_lines, clefs, time_signatures,
                               staff, staff_spacing, staff_distance)


def remove_whole_notes(images, whole_notes, regions):
    return mc.remove_whole_notes(images, whole_notes, regions)


def find_rests(image, regions, bar_lines):
    return mc.find_rests(image, regions, bar_lines)


def remove_rests(images, rests, regions):
    return mc.remove_whole_notes(images, rests, regions)


def export_data(index, bar_lines, clefs, time_signatures, endings, notes,
                accidentals, dots, whole_notes, rests, staff, staff_spacing, staff_distance):
    print("Exporting data...")
    return mc.export_data(index, bar_lines, clefs, time_signatures, endings, notes,
                          accidentals, dots, whole_notes, rests, staff, staff_spacing, staff_distance)


def analyze_staff(img_wo_lines, staff, index, avg_staff_spacing, avg_staff_distance):
    print("Analyzing staff %s" % (index + 1))
    staff_image_top = staff[0][0] - avg_staff_distance//2
    staff_image_bot = staff[-1][-1] + avg_staff_distance//2
    staff_image = img_wo_lines[staff_image_top: staff_image_bot]
    staff_copy = staff_image.copy()

    img_vert_lines = open_image_vertically(staff_image, avg_staff_spacing)
    vertical_lines = find_regions(img_vert_lines, pixel_span=1, eight_way=False)[1]
    img_vert_objects, vertical_regions = \
        find_vertical_regions(staff_image, img_vert_lines,
                              avg_staff_spacing, pixel_span=1, eight_way=False)
    bar_lines = get_bar_lines(vertical_regions, vertical_lines, staff)
    remove_bar_lines([staff_image, img_vert_lines],
                     bar_lines, [])

    img_vert_objects, vertical_regions = \
        find_vertical_regions(staff_image, img_vert_lines,
                              avg_staff_spacing, pixel_span=3)
    clefs = get_clefs(staff_image, vertical_regions, bar_lines)
    remove_clefs([staff_image, img_vert_objects, img_vert_lines], clefs, vertical_regions)

    endings = get_endings(staff_image, vertical_regions, staff[0][0] - staff_image_top)
    remove_endings([staff_image, img_vert_objects, img_vert_lines],
                   endings, vertical_regions)

    regions = find_regions(staff_image, pixel_span=1, eight_way=False)[1]
    dots = find_dots(staff_image, regions, avg_staff_spacing)
    remove_dots([staff_image], dots, [regions])

    img_vert_lines = imo.open_image_vertically(staff_image, avg_staff_spacing, 3.5)
    img_vert_objects, vertical_regions = \
        find_vertical_regions(staff_image, img_vert_lines,
                              avg_staff_spacing, pixel_span=2, eight_way=True)

    img_vert_lines = imo.open_image_vertically(staff_image, avg_staff_spacing, 1.5)
    img_vert_objects, vertical_regions = \
        find_vertical_regions(imo.image_subtract(staff_image, img_vert_objects), img_vert_lines,
                              avg_staff_spacing, pixel_span=1, eight_way=False)
    accidentals = find_accidentals(img_vert_objects, vertical_regions)
    remove_accidentals([staff_image], accidentals, None)

    img_vert_objects, vertical_regions = \
        find_vertical_regions(staff_image, img_vert_lines,
                              avg_staff_spacing, pixel_span=2)
    time_signatures = get_time_signatures(staff_image, vertical_regions, bar_lines,
                                          [clef[0] for clef in clefs])
    remove_time_signatures([staff_image, img_vert_objects, img_vert_lines],
                           time_signatures, vertical_regions)

    img_vert_objects, vertical_regions = \
        find_vertical_regions(staff_image, img_vert_lines,
                              avg_staff_spacing, pixel_span=4, eight_way=True)
    notes = find_vertical_notes(img_vert_objects, vertical_regions, staff,
                                avg_staff_spacing, avg_staff_distance)
    remove_vertical_notes([staff_image, img_vert_objects, img_vert_lines],
                          notes, vertical_regions)

    remove_ledgers([staff_image], regions, staff, avg_staff_distance)

    regions = find_regions(staff_image, pixel_span=2)[1]
    rests = find_rests(staff_image, regions, bar_lines)
    remove_rests([staff_image], [rest[0] for rest in rests], [regions])

    regions = find_regions(staff_image, pixel_span=3)[1]
    whole_notes = find_whole_notes(staff_image, regions, bar_lines, [clef[0] for clef in clefs],
                                   [time_signature[0] for time_signature in time_signatures],
                                   staff, avg_staff_spacing, avg_staff_distance)
    remove_whole_notes([staff_image], [note[0] for note in whole_notes], [regions])

    export_data(index, bar_lines, clefs, time_signatures, endings, notes,
                accidentals, dots, whole_notes, rests, staff, avg_staff_spacing, avg_staff_distance)
    imp.display_image(staff_copy)


def perform_recognition(image_name):
    org_image = load_image(image_name)
    img_gray = image_gray(org_image)
    img_bin = imp.image_bin_adaptive(img_gray, 9)
    inv_img = invert(img_bin)
    lines, line_distances, avg_staff_spacing,\
        staff_distances, avg_staff_distance = find_lines(inv_img)
    img_wo_lines = remove_lines(inv_img, lines)
    for index, staff in enumerate(lines):
        analyze_staff(img_wo_lines, staff, index, avg_staff_spacing, avg_staff_distance)

for f in os.listdir("test_dataset"):
    try:
        print("File: %s" % f)
        perform_recognition("test_dataset/%s" % f)
    except Exception as e:
        print("ERROR!")
        print(e)