StyleTTS 2
UltraLe niveau humain de texte à parole avec transfert de style
À propos StyleTTS 2
StyleTTS 2 permet de réaliser une synthèse texte-discours au niveau humain grâce à la diffusion de style et à la formation contradictoire. Il peut transférer des styles de parole de référence audio tout en générant un discours très naturel qui rivalise avec de vrais enregistrements humains. StyleTTS 2 représente l'état de la technique en qualité et en naturel TTS.
Caractéristiques principales
Qualité au niveau humain
Produit la parole indistinctible à partir des enregistrements humains dans des tests aveugles.
Transfert de style
Transférer le style de parole à partir de n'importe quel échantillon audio de référence.
Prosodie naturelle
Rythme parfait, stress et intonation avec modélisation basée sur la diffusion.
Clonage de la voix
Voix clonées avec une précision et une naturelité exceptionnelles.
Inférence rapide
Plus rapide que les modèles autorégressifs tout en maintenant la qualité.
Source ouverte
MIT sous licence avec plein droit d'utilisation commerciale.
Cas d'utilisation
StyleTTS 2 Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENComment utiliser StyleTTS 2
-
1
Inscrivez-vous gratuitement ou lancez la démo
Créez un compte gratuit TextToSpeechAI pour obtenir des crédits de démarrage, ou utilisez la démo de la page d'accueil pour entendre StyleTTS2 sans vous connecter.
-
2
Choisissez le moteur StyleTTS2
Sélectionnez une voix StyleTTS2 dans la bibliothèque vocale. Pour cloner une voix, téléchargez un clip de référence de 10-30 secondes et StyleTTS2 transférera son style.
-
3
Saisissez votre texte
Coller ou taper le script que vous voulez narré. StyleTTS2 excelle en anglais et délivre la prosodie naturelle, le stress et l'intonation sur de longs passages.
-
4
Générer l'audio
Cliquez sur générer et TextToSpeechAI rend votre audio StyleTTS2 sur GPU. Ultra-tier StyleTTS2 coûte 50 crédits par 1000 caractères.
-
5
Télécharger ou utiliser l'API
Téléchargez l'audio de StyleTTS2 fini en MP3, WAV ou OGG, ou appelez l'API TextToSpeechAI avec votre voix StyleTTS2 pour automatiser la génération.
StyleTTS 2 API
Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS 2 produit des paroles si naturelles, il rivalise avec les enregistrements humains professionnels.",
"voice": "styletts2-default"
}'
Foire aux questions
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50