GitHub - ruaruaruabick/SiD-W: A Flow-based Generative Network for Speech Synthesis

SiD-Waveflow

This work is the implemention of SiD-Waveflow.

Visit our website for audio samples.

Clone our repo and initialize submodule

git clone https://github.com/NVIDIA/waveglow.git
cd waveglow
git submodule init
git submodule update

Download CSMSC. In this example it's in ~/BBdata/
Train
```
mkdir checkpoints
python train.py -c config.json
```
For mixed precision training set "fp16_run": true on config.json.
Make test set mel-spectrograms

python mel2samp.py -f traintestset_chn/test_files_copy.txt -o ./inferaudio/chn_mel -c config.json

Do inference with your network

ls inferaudio/chn_mel/*.pt > mel_files.txt
python3 inference.py -f mel_files.txt -w checkpoints/test1_chn_model -o ./inferaudio --is_fp16 -s 0.6

Name		Name	Last commit message	Last commit date
Latest commit History 91 Commits
.idea		.idea
.vscode		.vscode
traintestset_chn		traintestset_chn
traintestset_eng		traintestset_eng
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
config.json		config.json
convert_model.py		convert_model.py
denoiser.py		denoiser.py
distributed.py		distributed.py
generatetrain.py		generatetrain.py
glow.py		glow.py
glow_old.py		glow_old.py
inference.py		inference.py
mel2samp.py		mel2samp.py
mel_files.txt		mel_files.txt
mel_test.txt		mel_test.txt
requirements.txt		requirements.txt
train.py		train.py
waveglow_logo.png		waveglow_logo.png