Python Tacotron2Logger.add_audio Exemples

Langage de programmation: Python

Espace de nommage/Pack: logger

Class/Type: Tacotron2Logger

Méthode/Fonction: add_audio

Exemples au hotexamples.com: 2

Python Tacotron2Logger.add_audio - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de logger.Tacotron2Logger.add_audio extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Tacotron2Logger(8)

add_audio(2)

Méthodes fréquemment utilisées

Tacotron2Logger (8)

add_audio (2)

Exemple #1

0

Afficher le fichier

def log_audio(model: Tacotron2, iteration: int, logger: Tacotron2Logger, waveglow): text = "Does it work yet?" sequence = array(text_to_sequence(text, ['english_cleaners']))[None, :] sequence = torch.autograd.Variable( torch.from_numpy(sequence)).cuda().long() mel_outputs, mel_outputs_postnet, _, alignments = model.inference(sequence) with torch.no_grad(): audio = waveglow.infer(mel_outputs_postnet, sigma=0.666) logger.add_audio(text, audio[0].data.cpu(), global_step=iteration, sample_rate=hparams.sampling_rate)

Exemple #2

0

Afficher le fichier

def log_audio(model: Tacotron2, iteration: int, logger: Tacotron2Logger, waveglow, inference_batch, text_encoded, mel): # load source data to obtain rhythm using tacotron 2 as a forced aligner x, y = model.parse_batch(inference_batch) with torch.no_grad(): # get rhythm (alignment map) using tacotron 2 mel_outputs, mel_outputs_postnet, gate_outputs, rhythm = model.forward( x) rhythm = rhythm.permute(1, 0, 2) for emotion in range(4): emotion_id = torch.LongTensor([emotion]).cuda() with torch.no_grad(): mel_outputs, mel_outputs_postnet, gate_outputs, _ = model.inference_noattention( (text_encoded, mel, emotion_id, rhythm)) audio = waveglow.infer(mel_outputs_postnet, sigma=0.8) logger.add_audio(f"Emotion {str(emotion)}", audio[0].data.cpu(), global_step=iteration, sample_rate=hparams.sampling_rate)