Kokoro
StandardBlitzschnelles, leichtes TTS mit natürlicher Qualität
Über Kokoro
Kokoro ist ein ultraleichtes 82M-Parameter-TTS-Modell, das bei unglaublicher Geschwindigkeit natürlich klingende Sprache liefert. Es läuft in Echtzeit sogar auf CPU und ist damit ideal für Anwendungen, bei denen geringe Latenz kritisch ist. Kokoro unterstützt mehrere Sprachen und bietet Sprachmischfunktionen.
Hauptmerkmale
Ultraleichtgewicht
82M Parameter, ~300MB Modellgröße. Läuft auf CPU mit minimalen Ressourcen.
In der Nähe von Echtzeit
Erzeugt Sprache schneller als Wiedergabegeschwindigkeit, auch ohne GPU-Beschleunigung.
Mehrsprachig
Unterstützt Englisch, Französisch, Spanisch, Hindi, Japanisch, Chinesisch, Italienisch, Portugiesisch und Koreanisch.
Sprach-Mischung
Mischen Sie zwei Stimmen zusammen, um einzigartige Stimmkombinationen zu schaffen.
Anwendungsfälle
Verwendung Kokoro
-
1
Registrieren Sie sich kostenlos oder versuchen Sie die Demo
Erstellen Sie ein kostenloses TextToSpeechAI-Konto, um 200 Starter-Credits zu erhalten, oder nutzen Sie die No-Signup-Demo, um Kokoro sofort zu hören.
-
2
Wählen Sie eine Kokoro-Stimme
Öffnen Sie den Sprachbrowser und wählen Sie eine Kokoro-Stimme in Ihrer Zielsprache (9 unterstützt, vom Englischen bis zum Japanischen und Koreanischen).
-
3
Geben Sie Ihren Text ein
Geben Sie den gewünschten Text in den Editor ein oder fügen Sie ihn ein. Kokoro verarbeitet dank seines leichten 82M-Parameters in der Nähe von Echtzeit-Engine effizient lange Passagen.
-
4
Geschwindigkeit einstellen und erzeugen
Setzen Sie die Wiedergabegeschwindigkeit auf Ihren Anwendungsfall und klicken Sie dann auf Generate. Kokoro rendert Audio schneller als Echtzeit, so dass Ihre Rede fast sofort fertig ist.
-
5
API herunterladen oder verwenden
Laden Sie das fertige Audio als MP3 oder WAV herunter oder automatisieren Sie die Generierung über die TextToSpeechAI REST API bei api.texttospeechai.com für Batch- und Echtzeit-Workloads.
Kokoro API
Erzeugen Sie Sprache programmatisch mit der TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro liefert natürliche Sprache mit unglaublicher Geschwindigkeit und Effizienz.",
"voice": "en_US-lessac-medium"
}'
Häufig gestellte Fragen
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10