Zak TTS
StandardUltra lichtgewicht stemklonen die real-time op CPU draait
Info Zak TTS
Pocket TTS van Kyutai is een ultralichtgewicht 100M parameter tekst-tot-spraak model dat in real-time draait op CPU. Ondanks zijn kleine grootte, ondersteunt het stemklonen vanaf slechts 5 seconden referentie audio. Perfect voor randimplementatie, mobiele toepassingen, en scenario's waar GPU-bronnen zijn beperkt. Momenteel ondersteunt Engels en Frans.
Belangrijkste kenmerken
Ultralichtgewicht
100M parameters - draait real-time op CPU met minimale middelen.
Stemklonen
Kloon elke stem van slechts 5 seconden referentie audio, zelfs op CPU.
Real-time op CPU
Geen GPU nodig. Genereert spraak met realtime snelheid op standaard hardware.
Rand-klaar
Klein genoeg voor mobiele apparaten, Raspberry Pi, en ingebedde systemen.
Gebruik kasten
Hoe gebruikt u dit middel? Zak TTS
-
1
Gratis aanmelden of probeer de demo
Maak een gratis TextToSpeechAI-account aan om startercredits te ontvangen, of gebruik de demo op de site om Pocket TTS te horen voordat u zich aanmeldt. Er is geen GPU of lokale installatie nodig.
-
2
Selecteer Pocket TTS en voeg een stem toe aan kloon
Kies Pocket TTS als uw motor, dan upload een korte referentie clip van ongeveer 5 tot 10 seconden om die stem te klonen. Pocket TTS draait volledig op CPU, dus klonen is snel en lichtgewicht.
-
3
Voer uw tekst in
Typ of plak de Engelse of Franse tekst die u wilt spreken. Houd een oogje op de karakters tellen, aangezien Pocket TTS rekeningen tegen het standaard tarief van 10 credits per 1000 tekens.
-
4
Het audio-bestand aanmaken
Klik op genereren en Pocket TTS synthetiseert uw tekst in de gekloonde stem op real-time snelheid. De meeste clips zijn klaar in seconden omdat het model zo klein en CPU-efficiënt is.
-
5
Download of gebruik de API
Download de voltooide audio, of automatiseer generatie via de TextToSpeechAI REST API op api.texttospeechai.com met behulp van uw account token. De API stelt dezelfde Pocket TTS klonen en synthese voor uw eigen apps bloot.
Zak TTS API
Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS levert stemklonen die in real\u002Dtime draait, zelfs op CPU.",
"voice": "en_US-lessac-medium"
}'
Veelgestelde vragen
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10