GitHub - ArtsiomKrauchanka/music_genre_classification: Music genre classification using Naive Bayes and KNN algorithms

KLASYFIKACJA GATUNKU MUZYKI na podstawie KNN i Naive Bayes

1. Streszczenie projektu

Celem projektu jest implementacja aplikacji pozwalającej na klasyfikację gatunku wybranego pliku audio formatu (wav.) na podstawie algorytmów k-najbliższych sąsiadów oraz naive bayes.

Zaimplementowana aplikacja w pełni realizuje powyższy cel. W dodatek aplikacja nie jest powiązana z konkretnymi gatunkami. Gatunki, jak i sukces aproksymacji zależą od bazy danych.

Bazę danych można zbudować własnoręcznie. Aplikacja wspiera następujący format bazy:

Folder*nazwa_bazy*/1..*nazwa_gatunku*/ 1.. *nazwa_audio.wav*

Przy zmianie bazy danych są ponownie trenowane modele, co dla bazy posiadającej 1000 plików audio (1,23GB) trwa ok. 30 min.

2. Wykorzystanie technologie / biblioteki

Nazwa biblioteki - Opis wykorzystanych metod z biblioteki

Librosa - Biblioteka służy do analizy audio

load(track_path) – przedstawia audio w wygodny do analizy sposób

feature.spectral_centroid - centrum masy sygnału,

feature.spectral_rolloff – spadek sygnału

feature.zero_crossing_rate - przedkość zmiany sygnału

feature.chroma_stft – charakterystyka tonacji

feature.mfcc - charakterystyki spektru

Numpy - Biblioteka do pracy z macierzami

Abstractmethod – annotacja do metody abstrakcyjnej

ABC – Do realizacji mechanizmów dziedziczenia

Tkinter – realizacja interfejsu

filedialog.askopenfile – do wskazania pliku

filedialog.askdirectory - do wskazania folderu

3. Architektura

Realizowany został wzorzec „Strategia”:

Klasa Classifier jest klasyfikatorem, który może dokonać klasyfikacji gatunku używając obiektów implementujących klasę abstrakcyjną Model (kilka metod jest używana w obu model np. count_distance()).

Klasa główna – Main posiada realizacje interfejsu oraz obiekt Classifier do realizacji klasyfikacji.

4. Zrzuty ekranów z projektu

Widok startowy projektu:

Na górze są wskazane wybrana baza oraz plik audio (na widoku startowym jeszcze nie wybrany). Domyślnie używana jest baza używana poprzednio.

Następna sekcja – Menu.W menu dostępne dwie opcje: wybór bazy danych, wybór pliku audio.

Sekcja „Start” zawiera przycisk startujący obliczenia.

Następna sekcja – wyniki. Pięć najlepiej pasujących gatunków, od najbardziej do mniej, według dwóch algorytmów KNN i Bayesa.

Ostatnia sekcja – status. Wyświetla różne obecne statusy programu np.” trwa obliczenie” lub wskazuje rekomendacje. Poniższy przykład pokazuje „choose audio” – nie wybrano pliku, ale naciśnięto przycisk „start”.

Wybór plika audio:

Program też posiada wyjścia do wiersza poleceń – zostało to zrobione do debagowania, ale

zdecydowałem to zostawić, ponieważ wskazuje to etap, na którym są obliczenia w momencie

gdy nie odpowiada aplikacja.

Poniżej przykład obliczenia najlepszego k do algorytmu KNN:

Poniżej są przykłady wyników działania aplikacji:

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
readme_images		readme_images
README.md		README.md
average_distance.npy		average_distance.npy
bayes.py		bayes.py
bd_path.txt		bd_path.txt
bestK.txt		bestK.txt
classifier.py		classifier.py
extract_funtions.py		extract_funtions.py
genres.npy		genres.npy
genres_features.npy		genres_features.npy
knn.py		knn.py
main.py		main.py
model.py		model.py
prob_genres_feature_array.npy		prob_genres_feature_array.npy

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

readme_images

readme_images

README.md

README.md

average_distance.npy

average_distance.npy

bayes.py

bayes.py

bd_path.txt

bd_path.txt

bestK.txt

bestK.txt

classifier.py

classifier.py

extract_funtions.py

extract_funtions.py

genres.npy

genres.npy

genres_features.npy

genres_features.npy

knn.py

knn.py

main.py

main.py

model.py

model.py

prob_genres_feature_array.npy

prob_genres_feature_array.npy

Repository files navigation

About

Releases

Packages

Languages

ArtsiomKrauchanka/music_genre_classification

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Languages