Skip to content

sukorenomw/MFCC-and-LVQ-for-TDSV

Repository files navigation

Implementasi Penerapan MFCC dan LVQ untuk pengenalan pembicara

Installation

Dependancy

  1. Python 2.7.10 or greater, can be downloaded here
  2. Scipy and Numpy for python, can be downloaded here
  3. SoX - Sound eXchange audio library, can be downloaded here

for windows user you can install WinPython bundle (included scipy and numpy pack)

Program Explanation

Training

Keterangan:

  1. Menu untuk mengganti ke tampilan training, testing atau batch features extraction.
  2. Menu untuk menampilkan option help.
  3. Tombol untuk memilih satu audio file.
  4. Tombol untuk play audio.
  5. Tombol untuk pause audio.
  6. Tombol untuk stop audio.
  7. Kontrol volume audio.
  8. Input field kelas keluaran.
  9. Tombol untuk mengekstraksi fitur dan menyimpannya ke dalam database.
  10. Table hasil ekstraksi fitur.
  11. Informasi nama audio file.
  12. Informasi jumlah sampel pada audio file.
  13. Informasi Frequency Sampling pada audio file.
  14. Double spinbox untuk mengganti nilai parameter Learning Rate.
  15. Double spinbox untuk mengganti nilai parameter pengurangan Learning Rate.
  16. Input field untuk mengganti nilai parameter jumlah iterasi.
  17. Tombol untuk mengeksekusi pelatihan data.
  18. Tombol untuk reload daftar database yang baru ditambahkan.
  19. Combo box untuk memilih database yang ingin digunakan.
  20. Tabel hasil bobot akhir pelatihan data.

Batch features extraction

Keterangan:

  1. Tombol untuk memilih file-file audio.
  2. Tombol untuk mengekstraksi fitur dari semua audio file yang dipilih dan menyimpannya ke dalam database.
  3. Tombol untuk memilih satu audio file.
  4. Tabel untuk menampilkan file-file audio yang dipilih.

Testing File

Keterangan:

  1. Menu untuk mengganti ke tampilan training atau testing.
  2. Menu untuk menampilkan option help.
  3. Tombol untuk memilih satu audio file.
  4. Tombol untuk play audio.
  5. Tombol untuk pause audio.
  6. Tombol untuk stop audio.
  7. Kontrol volume audio.
  8. Input field kelas keluaran.
  9. Tombol untuk mengekstraksi fitur.
  10. Informasi nama audio file.
  11. Informasi jumlah sampel pada audio file.
  12. Informasi Frequency Sampling pada audio file.
  13. Combo box untuk memilih database yang ingin digunakan.
  14. Tombol untuk mengidentifikasi pembicara.
  15. Informasi nama pembicara yang teridentifikasi.
  16. Informasi kata yang teridentifikasi.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages