Dia
UltraUz dialogu orientēti TTS ar balss klonēšanu un neverbālām skaņām
Par Dia
Dia — Nari Labs ir 1.6B parametru parametrs, kas orientēts uz tekstu uz skaņas skaņas modeli. Tas ir lielisks veids, kā radīt dabisku sarunu runu ar neverbālu skaņu atbalstu, piemēram, smiekliem, smiņām un klepus. Dia atbalsta daudzslāņu dialoga un balss klonēšanu no 5-10 sekundēm uz atskaites audio, padarot to ideāli piemērotu reālu sarunu un rakstura balsi radīšanai.
Galvenās iezīmes
Dialoga ģenerēšana
Radīt dabas multi-speak sarunas ar atšķirīgām balsīm un pagrieziena.
Neverbālās skaņas
Pievienojiet [smejas], [sejas], [smagas], (smadzenes) dabiskai paralingvistiskai izteiksmei.
Balss klonēšana
Apklājiet jebkuru balsi no 5-10 sekundes atsauces audio personalizētu runu.
Dabas sarunas
1.6B parametri rada ļoti dabisku saruna prozodi un intonāciju.
Lietot gadījumus
Kā lietot Dia
-
1
Pierakstīties bez maksas vai atvērt demo
Izveidot bezmaksas TextToSpeechAI kontu pieprasīt savu sākumsarakstu kredītu, vai atvērt bez paraksta demo, lai mēģinātu Dia dialogs uzreiz.
-
2
Izvēlieties Dia motoru
TTS panelī Dia izvēlas no motoru saraksta. Dia ir uz dialogu orientēts, īpaši kvalitatīvs modelis ar daudzslāņu un balss klanēšanas atbalstu.
-
3
Rakstīt dialoga skriptu ar tagiem
Sarunu var veidot, izmantojot [S1] un [S2], lai atzīmētu katru runātāju pagriezienu, un nometot neverbālās atzīmes, piemēram, [smejas], [smadzenes], [smadzenes] vai (smadzenes), kur vēlaties dabiskas reakcijas.
-
4
Ģenerēt audio
Noklikšķiniet, lai nosūtītu Dia skriptu uz mūsu hosting GPUs. Dia padara divu skaļruņu dialogu ar pagrieziena un jūsu neverbālā tags vienā audio failā.
-
5
Lejupielādēt vai izsaukt API
Lejupielādēt pabeigto dialogu jūsu izvēlētajā formātā, vai automatizēt to, ievietojot to pašu [S1]/[S2] skriptu TextToSpeechAI API ar savu kontu žetonu.
Dia API
Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Sveiks! Kā tu šodien esi? [Smejas] [S2] Es daru lielu, paldies par jautāšanu!",
"voice": "en_US-lessac-medium"
}'
Bieži uzdoti jautājumi
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50