Zonos
UltraIšraiškingas balso klonavimas su emocijomis ir stiliumi
Apie Zonos
Zonos by Zyphra yra 1.6B parametro teksto-į-speech modelis su pažangiu emocijų ir stilių valdymo. Ji palaiko balso klonavimo nuo 5-30 sekundžių atskaitos garso ir gali moduliuoti emocinį sukurtos kalbos toną. Pasirinkite iš emocijų, pavyzdžiui, laimės, liūdesio, pykčio, baimės, nuostabos, ir pasibjaurėjimo sukurti labai išraiškingas ir emocines niansuotas garso.
Pagrindinės savybės
Emocinė kontrolė
Kontroliuoti kalbos emocijas: laimę, liūdesį, pyktį, baimę, nuostabą, pasibjaurėjimą, ir neutralumą.
Balso klonavimas
Apdorokite bet kokį 5–30 sekundžių garso skambutį su dideliu patikimumu.
Išreikšta kalba
1.6B parametrai išryškina išraiškingą kalbą su niuansuotu emociniu gimdymu.
Daugiakalbis
Palaiko anglų, japonų, kinų, prancūzų ir vokiečių.
Naudoti atvejus
Kaip vartoti Zonos
-
1
Užregistruoti arba atverti demo
Sukurti nemokamą TextToSpeechAI paskyra gauti starter kreditus, arba naudoti no-Signup demo išbandyti Zonos iš karto.
-
2
Pasirinkite Zonos variklį
Pasirinkite Zonos iš balso ir modelio parinkiklis. Norėdami klonuoti balsą, įkelkite 5-30 sekundžių švaraus orientacinio garso, kad Zonos galėtų atitikti garsiakalbį.
-
3
Įveskite savo tekstą
Įveskite arba įklijuokite scenarijų norite kalbėti. Zonos veikia anglų, japonų, kinų, prancūzų ir vokiečių kalbomis.
-
4
Pasirinkite emocijas ir generuokite
Pasirinkite vieną iš septynių Zono emocijų - neutralią, laimę, liūdesį, pyktį, baimę, nuostabą ar pasibjaurėjimą - tada spustelėkite generuoti išraiškingą kalbą toje nuotaikoje.
-
5
Atsisiųsti arba naudoti API
Žaisti ir atsisiųsti baigtas garso, arba skambinti tas pats Zonos variklio programmaticly per TextToSpeechAI REST API automatinių darbo srautus.
Zonos API
Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos generuoja neįtikėtinai išraiškingą kalbą su smulkia emocijų kontrole.",
"voice": "en_US-lessac-medium"
}'
Dažnai užduodami klausimai
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50