TTS de poche
StandardClonage vocal ultra léger qui fonctionne en temps réel sur CPU
À propos TTS de poche
Pocket TTS by Kyutai est un modèle de texte à parole ultra léger de 100M qui fonctionne en temps réel sur CPU. Malgré sa petite taille, il supporte le clonage vocal à partir de seulement 5 secondes d'audio de référence. Parfait pour le déploiement des bords, les applications mobiles et les scénarios où les ressources du GPU sont limitées.
Caractéristiques principales
Ultra-léger
Paramètres 100M - fonctionne en temps réel sur CPU avec des ressources minimales.
Clonage de la voix
Clone n'importe quelle voix à partir de seulement 5 secondes de son de référence, même sur CPU.
Temps réel sur CPU
Pas de GPU requis. Génére la parole à vitesse en temps réel sur le matériel standard.
Prêt à l'emploi
Assez petit pour les appareils mobiles, Raspberry Pi et les systèmes embarqués.
Cas d'utilisation
Comment utiliser TTS de poche
-
1
Inscrivez-vous gratuitement ou essayez la démo
Créez un compte gratuit TextToSpeechAI pour recevoir des crédits de démarrage, ou utilisez la démo sur place pour entendre Pocket TTS avant de vous inscrire. Pas besoin d'installation GPU ou locale.
-
2
Sélectionnez Pocket TTS et ajoutez une voix au clone
Choisissez Pocket TTS comme moteur, puis téléchargez un court clip de référence d'environ 5 à 10 secondes pour cloner cette voix. Pocket TTS fonctionne entièrement sur CPU, donc le clonage est rapide et léger.
-
3
Saisissez votre texte
Tapez ou collez le texte anglais ou français que vous voulez parler. Gardez un œil sur le nombre de caractères, puisque Pocket TTS facture au taux standard de 10 crédits par 1000 caractères.
-
4
Générer l'audio
Cliquez sur générer et Pocket TTS synthétise votre texte dans la voix clonée à une vitesse en temps réel. La plupart des clips sont prêts en quelques secondes parce que le modèle est si petit et efficace CPU.
-
5
Télécharger ou utiliser l'API
Téléchargez l'audio fini, ou automatisez la génération à travers l'API TextToSpeechAI REST sur api.texttospeechai.com en utilisant votre jeton de compte. L'API expose le même clonage et synthèse Pocket TTS pour vos propres applications.
TTS de poche API
Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS offre le clonage vocal qui fonctionne en temps réel, même sur CPU.",
"voice": "en_US-lessac-medium"
}'
Foire aux questions
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10