Text-To-Speech
Text-To-Speech permet de générer de la parole artificielle à partir de n’importe quel texte
Le module Text-To-Speech génère de la parole à partir d’un texte digital. Il permet donc de convertir une écriture numérique en un fichier audio. Ce module se base sur le Deep Learning et un réseau de neurones convolutif pour son développement. La structure du modèle utilisée est très proche de celle d’un classificateur classique en utilisant des "Mel-Spectrogram" (image de l'audio) étiquetés avec du texte.