Dia
UltraTTS orientat la dialog cu clonarea vocală și sunete nonverbale
Despre Dia
Dia by Nari Labs este un model de dialog de 1,6B cu text-la-speech. Excele la generarea de discurs de conversație naturală cu sprijin pentru sunetele nonverbale, precum râsete, sufocuri și tuse. Dia sprijină generarea de dialog multi-speaker și clonarea vocală de la 5-10 secunde de audio de referință, făcând-o ideal pentru crearea de conversații realiste și voci de caracter.
Caracteristici cheie
Generație dialog
Generati conversatii multi-parlanti naturale cu voci distincte si turn-apping.
Sunete neverbale
Adaugă [rade], [oftează], [tuse], (guse) pentru expresia paralinguist natural.
Clonarea vocii
Clonează orice voce de la 5-10 secunde de audio de referință pentru discurs personalizat.
Conversație naturală
Parametrii 1.6B produc prostodie conversativă și intonare extrem de naturală.
Cazuri de utilizare
Cum să utilizaţi Dia
-
1
Inregistrează-te gratuit sau deschide demo
Creați un cont gratuit de TextToSpeechAI pentru a solicita creditele de pornire, sau deschideți demo fără semnup pentru a încerca Dia dialog imediat.
-
2
Selectează motorul Dia
În bordul TTS alege Dia din lista motorului. Dia este modelul orientat la dialog, ultra-tier cu suport multi-speaker și de blocare vocală.
-
3
Scrie un script de dialog cu etichete
Compune conversaţia folosind [S1] şi [S2] pentru a marca fiecare vorbitor se întoarce, şi scădea în etichete nonverbale cum ar fi [rade], [oftează], [tuse], sau (gazboi) unde doriţi reacţii naturale.
-
4
Generați audio
Faceţi clic pe generarea pentru a trimite scriptul Dia la GPUs nostru găzduit. Dia face dialogul cu două vorbitoare cu schimb de opţiuni şi tagurile dvs. nonverbale într-un singur fișier audio.
-
5
Descărcați sau sunați API
Descărcați dialogul terminat în formatul ales, sau automatizați-l prin postarea aceluiasi script [S1]/[S2] pe API TextToSpeechAI cu token cont.
Dia API
Generați discursul programmatic folosind API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Bună ziua, ce mai faci azi?",
"voice": "en_US-lessac-medium"
}'
Întrebări frecvente
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50