Kokoro
StandardTTS léger et rapide à la foudre avec une qualité naturelle
À propos Kokoro
Kokoro est un modèle TTS ultra léger de 82M qui offre un langage naturel à une vitesse incroyable. Il fonctionne presque en temps réel même sur CPU, ce qui le rend idéal pour les applications où la latence faible est critique. Kokoro prend en charge plusieurs langues et offre des capacités de mélange de voix.
Caractéristiques principales
Ultra-léger
Paramètres 82M, taille du modèle ~300MB. Exécute sur CPU avec des ressources minimales.
Presque en temps réel
Génére la parole plus rapidement que la vitesse de lecture, même sans accélération GPU.
Multi-langue
Soutient l'anglais, le français, l'espagnol, le hindi, le japonais, le chinois, l'italien, le portugais et le coréen.
Mélange de la voix
Mélanger deux voix pour créer des combinaisons vocales uniques.
Cas d'utilisation
Comment utiliser Kokoro
-
1
Inscrivez-vous gratuitement ou essayez la démo
Créez un compte gratuit TextToSpeechAI pour obtenir 200 crédits de démarrage, ou utilisez la démo sans signature pour entendre Kokoro instantanément. Le niveau standard signifie que Kokoro ne coûte que 10 crédits par 1000 caractères.
-
2
Choisissez une voix Kokoro
Ouvrez le navigateur vocal et sélectionnez une voix Kokoro dans votre langue cible (9 prises en charge, de l'anglais au japonais et coréen). Vous pouvez également utiliser le mélange vocal Kokoro pour mélanger deux voix dans une combinaison personnalisée.
-
3
Saisissez votre texte
Tapez ou collez le texte que vous souhaitez parler dans l'éditeur. Kokoro gère efficacement les longs passages grâce à son léger 82M-paramètre, près du moteur en temps réel.
-
4
Régler la vitesse et générer
Réglez la vitesse de lecture pour convenir à votre cas d'utilisation, puis cliquez sur Générer. Kokoro rend l'audio plus rapidement que le temps réel, de sorte que votre discours est prêt presque immédiatement.
-
5
Télécharger ou utiliser l'API
Téléchargez l'audio fini en MP3 ou WAV, ou automatisez la génération à travers l'API REST TextToSpeechAI sur api.texttospeechai.com pour les charges de travail en temps réel et en lots.
Kokoro API
Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro offre un langage naturel avec une vitesse et une efficacité incroyables.",
"voice": "en_US-lessac-medium"
}'
Foire aux questions
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10