Dia
UltraDijaloški orijentirani TTS s kloniranjem glasa i neverbalnim zvukovima
O Dia
Dia by Nari Labs je parametar 1.6B dijalog-focused text-to-speech model. Ona je izvrsna na generiranju prirodnog razgovora govor uz podršku za neverbalne zvukove poput smijeha, uzdiše i kašalj. Dia podržava višezvočnik dijaloga i kloniranje glasa od 5-10 sekundi referentnog audio, što ga čini idealnim za stvaranje realnih razgovora i karakternih glasova.
Ključne osobine
Dijaloški prozor
Generirati prirodne multi-zvučni razgovori s različitim glasovima i okretanjem.
Neverbalni zvukovi
Dodaj [smijeh], [uzdiše], [kašlja], (bori) za prirodni paralinguistički izraz.
Kloniranje glasa
Kloniraj bilo koji glas iz 5-10 sekundi referentnog zvuka za personalizirani govor.
Prirodni razgovor
1.6B parametri proizvode vrlo prirodnu konverzaciju i intonaciju.
Slučaji korištenja
Kako koristiti Dia
-
1
Prijavite se besplatno ili otvorite demo
Napravite besplatni TextToSpeechAI račun za zahtjev za početne kredite, ili otvorite demo za ne-signup da biste odmah pokušali Dia dijalog.
-
2
Odaberite Dia motor
U TTS panelu odaberite Dia sa popisa motora. Dia je dijalog-orijentirani, ultra-tier model s višezvučnikom i glasovno-kloniranje podršku.
-
3
Napiši dijalog skriptu s oznakama
Sastavite svoj razgovor koristeći [S1] i [S2] za označavanje svakog govornika okretanje, i ispustite u neverbalne oznake kao što su [smijeh], [uzdiše], [kašalj], ili (gasps) gdje želite prirodne reakcije.
-
4
Generiraj zvuk
Kliknite generirati za slanje Dia skripte na naš domaćin GPUs. Dia prikazuje dvozvučni dijalog s turn-uuzimanje i vaše neverbalne oznake u jednu zvučnu datoteku.
-
5
Preuzmi ili pozovi API
Preuzmite završetak dijaloga u odabranim formatu, ili ga automatizirajte objavljivanjem iste [S1]/[S2] skripte na TextToSpeechAI API s vašim žetonom računa.
Dia API
Generiraj govor programski koristeći TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kako si danas?",
"voice": "en_US-lessac-medium"
}'
Česta pitanja
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50