Taschen-TTS
StandardUltraleichtes Stimmenklonen, das in Echtzeit auf CPU läuft
Über Taschen-TTS
Pocket TTS von Kyutai ist ein ultraleichtes 100M-Parameter-Text-to-Speech-Modell, das in Echtzeit auf CPU läuft. Trotz seiner winzigen Größe unterstützt es Sprachklonen aus nur 5 Sekunden Referenz-Audio. Perfekt für Edge-Deployment, mobile Anwendungen und Szenarien, in denen GPU-Ressourcen begrenzt sind. Derzeit unterstützt Englisch und Französisch.
Hauptmerkmale
Ultraleichtgewicht
100M Parameter - läuft in Echtzeit auf CPU mit minimalen Ressourcen.
Stimme Klonen
Klonen Sie jede Stimme von nur 5 Sekunden Referenz-Audio, auch auf CPU.
Echtzeit auf CPU
Keine GPU erforderlich. Erzeugt Sprache mit Echtzeit-Geschwindigkeit auf Standard-Hardware.
Randbereit
Klein genug für mobile Geräte, Raspberry Pi und eingebettete Systeme.
Anwendungsfälle
Verwendung Taschen-TTS
-
1
Registrieren Sie sich kostenlos oder versuchen Sie die Demo
Erstellen Sie ein kostenloses TextToSpeechAI-Konto, um Starter-Gutschriften zu erhalten, oder nutzen Sie die Vor-Ort-Demo, um Pocket TTS vor der Anmeldung zu hören.
-
2
Wählen Sie Pocket TTS und fügen Sie eine Stimme zu klonen
Wählen Sie Pocket TTS als Ihre Engine, dann laden Sie einen kurzen Referenzclip von etwa 5 bis 10 Sekunden, um diese Stimme zu klonen. Pocket TTS läuft vollständig auf CPU, so Klonen ist schnell und leicht.
-
3
Geben Sie Ihren Text ein
Geben Sie den gewünschten englischen oder französischen Text ein oder fügen Sie ihn ein. Behalten Sie die Anzahl der Zeichen im Auge, da Pocket TTS Rechnungen bei der Standardrate von 10 Credits pro 1.000 Zeichen.
-
4
Erzeugen des Audios
Klicken Sie auf erzeugen und Pocket TTS synthetisiert Ihren Text in der geklonten Stimme mit Echtzeit-Geschwindigkeit. Die meisten Clips sind in Sekunden bereit, weil das Modell so klein und CPU-effizient ist.
-
5
API herunterladen oder verwenden
Laden Sie das fertige Audio herunter oder automatisieren Sie die Generation über die TextToSpeechAI REST API bei api.texttospeechai.com mit Ihrem Konto-Token. Die API stellt das gleiche Pocket TTS Klonen und Synthese für Ihre eigenen Apps frei.
Taschen-TTS API
Erzeugen Sie Sprache programmatisch mit der TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS liefert Sprachklonen, die in Echtzeit läuft, auch auf CPU.",
"voice": "en_US-lessac-medium"
}'
Häufig gestellte Fragen
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10