Zonos
UltraUiterlike stem wat met emosie en stylbeheer bots
Aangaande Zonos
Zonos deur Zyphra is 'n 168B parameter teks-na-sech model met gevorderde emosie en styl kontrole. Dit ondersteun stem kloning van 5-30 sekondes van verwysing oudio en kan modifiseer die emosionele toon van opgewekte spraak. Kies van emosies soos geluk, hartseer, woede, vrees, verrassing en afkeer om uiters requeer en emosioneel nuanceed klank te skep.
Sleutelbronne
Emosionele beheer
Beheers spraakgevoelens: geluk, hartseer, woede, vrees, verbasing, afkeer en neutraliteit.
Stemverkleuring
Rig enige stem van 5-30 sekondes van verwysingsoudio met hoë getrouheid.
Spreekwoorde
1,6B parameters gee baie uiting aan spraak met nuanse emosionele aflewering.
MultilingualGenericName
Ondersteun Engels, Japannees, Chinees, Frans en Duits.
Gebruik letterkase
Hoe om te gebruik Zonos
-
1
Teken op of open die demo
Create a free TextToSpeechAI account to get starter credits, or use the no-signup demo to try Zonos right away.
-
2
Kies die Zonos-enjin
Kies Zonos uit die stem en model kieser. Om 'n stem te kloon, laai 5- 30 sekondes skoon verwysing oudio sodat Zonos kan ooreenstem met die spreker.
-
3
Tik jou teks in
Sonos werk oor Engels, Japannees, Chinees, Frans en Duits.
-
4
Kies'n emosie en verwek dit
Kies een van die sewe Zanos - emosies - neutraliteit, geluk, hartseer, woede, vrees, verbasing of afkeer - en klik dan op'n manier om uiting te gee aan spraak in daardie stemming.
-
5
Laai af of gebruik die API
Play back and download the finished audio, or call the same Zonos engine programmatically through the TextToSpeechAI REST API for automated workflows.
Zonos API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos laat ongelooflik uiting gee aan spraak met fyngewortelde emosiebeheer.",
"voice": "en_US-lessac-medium"
}'
Vrae wat dikwels gevra word
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50