Zonos
UltraExpressief stemklonen met emotie en stijlbeheersing
Info Zonos
Zonos by Zyphra is een 1.6B parameter text-to-speech model met geavanceerde emotie en stijl controle. Het ondersteunt het klonen van stem van 5-30 seconden referentie audio en kan moduleren de emotionele toon van gegenereerde spraak. Kies uit emoties zoals geluk, verdriet, woede, angst, verrassing en walging om zeer expressieve en emotioneel genuanceerde audio te creëren.
Belangrijkste kenmerken
Emotiecontrole
Controle spraak emoties: geluk, verdriet, woede, angst, verrassing, walging en neutraal.
Stemklonen
Kloon elke stem van 5-30 seconden referentie audio met hoge trouw.
Uitdrukkingstoespraak
1.6B parameters produceren zeer expressieve spraak met genuanceerde emotionele levering.
Meertalig
Ondersteunt Engels, Japans, Chinees, Frans en Duits.
Gebruik kasten
Hoe gebruikt u dit middel? Zonos
-
1
Aanmelden of openen van de demo
Maak een gratis TextToSpeechAI account aan om starter credits te krijgen, of gebruik de no-signup demo om Zonos meteen te proberen.
-
2
Kies de Zonos-engine
Selecteer Zonos van de stem en model picker. Om een stem te klonen, upload 5-30 seconden van de schone referentie audio zodat Zonos kan overeenkomen met de luidspreker.
-
3
Voer uw tekst in
Typ of plak het script dat u wilt spreken. Zonos werkt in het Engels, Japans, Chinees, Frans en Duits.
-
4
Kies een emotie en genereren
Kies één van de zeven Zonos emoties - neutraal, geluk, verdriet, woede, angst, verrassing of walging - klik vervolgens op genereren om expressieve spraak in die stemming.
-
5
Download of gebruik de API
Speel terug en download de voltooide audio, of bel dezelfde Zonos-engine programmatisch via de TextToSpeechAI REST API voor geautomatiseerde workflows.
Zonos API
Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos genereert ongelooflijk expressieve spraak met fijnkorrelige emotie controle.",
"voice": "en_US-lessac-medium"
}'
Veelgestelde vragen
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50