Zonos
UltraExpresivní klonování hlasu s emocí a ovládáním stylu
O aplikaci Zonos
Zonos by Zyphra je parametr 1.6B text-to-speech model s pokročilým ovládáním emocí a stylu. Podporuje klonování hlasu od 5-30 sekund referenčního zvuku a může modulovat emocionální tón generované řeči. Vyberte si z emocí, jako je štěstí, smutek, hněv, strach, překvapení, a znechucení vytvořit vysoce expresivní a emocionálně nuanced audio.
Klíčové funkce
Řízení emocí
Řídit emoce řeči: štěstí, smutek, hněv, strach, překvapení, znechucení a neutrální.
Klonování hlasu
Klonovat jakýkoliv hlas z 5-30 sekund referenčního zvuku s vysokou věrností.
Výrazná řeč
1.6B parametry produkují vysoce expresivní řeč s nuanced emocionální dodání.
Vícejazyčné
Podporuje angličtinu, japonštinu, čínštinu, francouzštinu a němčinu.
Pouzdra na použití
Jak se používá Zonos
-
1
Zaregistrujte se nebo otevřete demo
Vytvořte zdarma TextToSpeechAI účet pro získání startér kreditů, nebo použijte demo no-signup vyzkoušet Zonos hned.
-
2
Vyberte si motor Zonos
Vyberte Zonos z hlasového a modelového sběrače. Chcete-li naklonovat hlas, nahrát 5-30 sekund čistého referenčního zvuku tak, aby Zonos může odpovídat reproduktoru.
-
3
Zadejte svůj text
Zadejte nebo vložte scénář, který chcete mluvit. Zonos pracuje napříč angličtinou, japonštinou, čínštinou, francouzsky a německy.
-
4
Vyberte si emoce a generovat
Vyberte si jednu ze sedmi Zonos emocí - neutrální, štěstí, smutek, hněv, strach, překvapení nebo znechucení - pak klikněte na tlačítko generovat, aby vyjádřit výraznou řeč v této náladě.
-
5
Stáhnout nebo použít API
Přehrajte a stáhněte hotový zvuk, nebo volejte stejný Zonos motor programově přes TextToSpeechAI REST API pro automatizované pracovní postupy.
Zonos API
Generovat řeč programově pomocí TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos generuje neuvěřitelně expresivní řeč s jemnou emocionální kontrolou.",
"voice": "en_US-lessac-medium"
}'
Často kladené otázky
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50