Dia
UltraDialoog- gedefinieerde TTS met stem kloning en nieverbale klanke
Aangaande Dia
Dia deur Nari Labs is 'n 1,6B parameter dialoog-geëkusde teks-na-sech model. Dit blink voort om natuurlike gespreksrede te genereer met ondersteuning vir nieverbale klanke soos gelag, sug, en hoes. Dia ondersteun multi-preser dialoog geslag en stem kloning van 5-10 sekondes van verwysing klank, wat dit ideaal maak om realistiese gesprekke en karakterstemme te skep.
Sleutelbronne
Dialoog geslag
Genereer natuurlike veelpraat gesprekke met verskillende stemme en heraanneming.
Nieverbale klanke
Voeg [lagte] by, [sakke], [skoene], (gasps) vir natuurlike paralinguistiese uitdrukking.
Stemverkleuring
Rig enige stem van 5-10 sekondes van verwysing oudio vir persoonlike spraak.
Natuurlike gesprekke
1,6B parameters produseer hoogs natuurlike gesprekspligte en intonasie.
Gebruik letterkase
Hoe om te gebruik Dia
-
1
Teken gratis op of open die demo
Create a free TextToSpeechAI account to claim your starter credits, or open the no-signup demo to try Dia dialogue right away.
-
2
Kies die Dia-enjin
In die TTS paneelbord kies Dia van die enjin lys. Dia is die dialoog-gemiddelde, ultra-ter model met multi-praater en stem-intonering ondersteuning.
-
3
Skryf 'n dialoogskrip met etiket
Skryf jou gesprek met [S1] en [S2] om elke spreker se beurt te merk, en val in nieverbale merkers soos [lagte], [sag], [skoene] of (gas) waar jy natuurlike reaksies wil hê.
-
4
Genereer die oudio
Kliek genereer na stuur jou Dia skrip na ons bediener GPUs. Dia gee die twee- praater dialoog met skakel-inbel en jou nonverbal etiket in 'n enkele oudio lêer.
-
5
Laai af of bel die API
Download the finished dialogue in your chosen format, or automate it by posting the same [S1]/[S2] script to the TextToSpeechAI API with your account token.
Dia API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Hoe is jy vandag? [S2] ek doen groot, dankie dat jy gevra het!",
"voice": "en_US-lessac-medium"
}'
Vrae wat dikwels gevra word
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50