CNNs - Soundscape Quality Estimation

##Synopsis

This project describes an approach on Soundscape Quality Estimation. To the best of our knowledge, the proposed method provides a novel approach to this problem by introducing multi-label classification, in order to assess the quality of a soundscape (i.e. an audio landscape) based on the qualitative evaluation of its individual sound elements. To achieve this task we employ a Deep Convolutional Neural Network (CNN) which operates on pseudocolored RGB frequency-images, which represent audio segments.

The repository consists of the following modules:

Audio segmentation using the PyAudio analysis library
CNN training using the Lasagne Deep-Learning Framework.
Audio classification using:
- CNNs
- CNNs using an ImageNet pre-trained model to initialize the neuron values
- CNNs using data augmentation
An audio dataset consisting of 30 second multi-label annotated instances of soundscape auditory data. At this point the data are available in the form of spectrograms. (to be added) The instances are annotated as e.g. {vehicles, voice_(children), rain} or {sirens, shouting}.

##Installation

Dependenices

* Installation instructions offered in detail on the above links

Data Preparation

Change the frequency of the audio files into 16000 Hz using changeFreq.py
Convert your audio files into pseudocolored RGB or grayscale spectrogram images using generateSpectrograms.py Data should be pseudo-colored RGB spectrogram images of size 227x227 as shown in Fig1 : Fig1. - Sample RGB Spectrogram
Distribute the generated spectrograms to their respective classes using fixDataset.sh

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
scripts		scripts
Multi-Label Test Metrics.csv		Multi-Label Test Metrics.csv
README.md		README.md
deepSoundscapeFinal.py		deepSoundscapeFinal.py
deepSoundscapeFinal.py~		deepSoundscapeFinal.py~
deepSoundscapeNoLearn.py		deepSoundscapeNoLearn.py
deepSounscape_PreTrained.py~		deepSounscape_PreTrained.py~
extractPreTrainingWeights.py~		extractPreTrainingWeights.py~
extractPreTrainingWeights~		extractPreTrainingWeights~
fixDataset.sh~		fixDataset.sh~
vehicles-Predicted Labels Negative Class-Test.csv		vehicles-Predicted Labels Negative Class-Test.csv
vehicles-Predicted Labels Negative Class.csv		vehicles-Predicted Labels Negative Class.csv
vehicles-Predicted Labels Positive Class-Test.csv		vehicles-Predicted Labels Positive Class-Test.csv
vehicles-Predicted Labels Positive Class.csv		vehicles-Predicted Labels Positive Class.csv
vehicles-TestMetrics.csv		vehicles-TestMetrics.csv
vehicles-ValidationMetrics.csv		vehicles-ValidationMetrics.csv
voice_(adults)-Predicted Labels Negative Class-Test.csv		voice_(adults)-Predicted Labels Negative Class-Test.csv
voice_(adults)-Predicted Labels Negative Class.csv		voice_(adults)-Predicted Labels Negative Class.csv
voice_(adults)-Predicted Labels Positive Class-Test.csv		voice_(adults)-Predicted Labels Positive Class-Test.csv
voice_(adults)-Predicted Labels Positive Class.csv		voice_(adults)-Predicted Labels Positive Class.csv
voice_(adults)-TestMetrics.csv		voice_(adults)-TestMetrics.csv
voice_(adults)-ValidationMetrics.csv		voice_(adults)-ValidationMetrics.csv
wind-Predicted Labels Negative Class-Test.csv		wind-Predicted Labels Negative Class-Test.csv
wind-Predicted Labels Negative Class.csv		wind-Predicted Labels Negative Class.csv
wind-Predicted Labels Positive Class-Test.csv		wind-Predicted Labels Positive Class-Test.csv
wind-Predicted Labels Positive Class.csv		wind-Predicted Labels Positive Class.csv
wind-TestMetrics.csv		wind-TestMetrics.csv
wind-ValidationMetrics.csv		wind-ValidationMetrics.csv

ChaogeCanFly/CNNs-Soundscape-Quality-Estimation

Folders and files

Latest commit

History

Repository files navigation

CNNs - Soundscape Quality Estimation

Data Preparation

About

Resources

Stars

Watchers

Forks

Languages