F5-TTS
PremiumRapide, fluide et fidèle Text-to-Speech avec Cloning
À propos F5-TTS
F5-TTS est un modèle de texte à parole non autorégressif qui permet une inférence rapide tout en maintenant une haute qualité et en supportant le clonage vocal. Grâce aux techniques de couplage de flux, il génère une parole naturelle avec une excellente fluidité et fidélité aux voix de référence.
Caractéristiques principales
Génération rapide
Architecture non autorégressive pour la synthèse rapide de la parole.
Clonage à chaud zéro
Clone toute voix d'un court échantillon audio sans réglage fin.
Fidélité élevée
L'appariement de flux produit une sortie de parole naturelle et de haute qualité.
Fluence naturelle
Prosodie lisse et rythme naturel à travers.
Multilingue
Supporte plusieurs langues avec prononciation naturelle.
Source ouverte
MIT homologué pour une utilisation commerciale complète.
Cas d'utilisation
Comment utiliser F5-TTS
-
1
Inscrivez-vous gratuitement ou ouvrez la démo
Créez un compte gratuit TextToSpeechAI pour recevoir des crédits de démarrage, ou sautez directement dans la démo gratuite pour essayer F5-TTS sans paiement nécessaire.
-
2
Choisissez F5-TTS et (facultativement) téléchargez un clip de référence
Pour cloner une voix, téléchargez un court échantillon de référence de 10-30 secondes de l'enceinte cible afin que F5-TTS puisse capturer leur ton et accent zéro-shot; sautez cette étape pour utiliser une voix F5-TTS intégrée.
-
3
Saisissez votre texte
Tapez ou collez le texte que vous voulez parler. F5-TTS le lit naturellement dans votre voix choisie ou clonée, avec une prosody lisse dans plusieurs langues prises en charge.
-
4
Générer le discours
Cliquez sur générer et F5-TTS synthétise rapidement votre son sur notre infrastructure GPU, facturée au taux Premium de 25 crédits par 1000 caractères.
-
5
Télécharger ou utiliser l'API
Téléchargez l'audio fini en MP3, WAV ou OGG, ou appelez l'API TextToSpeechAI avec votre ID vocal F5-TTS pour automatiser la génération dans vos propres applications.
F5-TTS API
Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "F5\u002DTTS offre une parole rapide et fluide avec des capacités impressionnantes de clonage vocal.",
"voice": "en_US-lessac-medium"
}'
Foire aux questions
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 3-4GB
- Credits/1000 chars 25