Zonos
UltraExpressive stemme kloning med følelser og stil kontrol
Om Zonos
Zonos by Zyphra er en 1.6B parameter tekst-til-tale model med avanceret følelse og stil kontrol. Det understøtter stemme kloning fra 5-30 sekunders reference audio og kan modulere den følelsesmæssige tone i genereret tale. Vælg mellem følelser som lykke, sorg, vrede, frygt, overraskelse og afsky for at skabe meget udtryksfulde og følelsesmæssigt nuanceret lyd.
Nøglefunktioner
Følelseskontrol
Kontrol tale følelser: lykke, sorg, vrede, frygt, overraskelse, afsky, og neutral.
Stemmekløvning
Klon enhver stemme fra 5-30 sekunders reference audio med høj troskab.
Udtrykt tale
1.6B parametre producerer meget udtryksfuld tale med nuanceret følelsesmæssig levering.
Flersproget
Understøtter engelsk, japansk, kinesisk, fransk og tysk.
Brugstilfælde
Hvordan man bruger Zonos
-
1
Tilmeld dig eller åbn demoen
Opret en gratis TextToSpeechAI konto for at få startkreditter, eller bruge no-signup demo til at prøve Zonos med det samme.
-
2
Vælg Zonos- motoren
Vælg Zonos fra stemme og model picker. For at klone en stemme, uploade 5-30 sekunders ren reference audio, så Zonos kan matche højttaleren.
-
3
Indtast din tekst
Indtast eller indsæt det script, du ønsker talt. Zonos arbejder på tværs af engelsk, japansk, kinesisk, fransk og tysk.
-
4
Vælg en følelse og generere
Vælg en af de syv Zonos følelser - neutral, lykke, sorg, vrede, frygt, overraskelse eller afsky - så klik generere at gøre udtryksfuld tale i dette humør.
-
5
Download eller brug API'en
Afspil og download den færdige lyd, eller ring til den samme Zonos motor programmatisk gennem TextToSpeechAI REST API til automatiserede arbejdsgange.
Zonos API
Generer tale programmatisk ved hjælp af TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos genererer utrolig udtryksfuld tale med finkornet følelsesmæssig kontrol.",
"voice": "en_US-lessac-medium"
}'
Ofte stillede spørgsmål
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50