Dia

Ultra

Uz dialogu orientēti TTS ar balss klonēšanu un neverbālām skaņām

Mēģināt atbrīvot Dia Pārlūkot balsis (0)

Medium Ātrums

Excellent Kvalitāte

Jā Klonēšana

1 Valodas

Par Dia

Dia — Nari Labs ir 1.6B parametru parametrs, kas orientēts uz tekstu uz skaņas skaņas modeli. Tas ir lielisks veids, kā radīt dabisku sarunu runu ar neverbālu skaņu atbalstu, piemēram, smiekliem, smiņām un klepus. Dia atbalsta daudzslāņu dialoga un balss klonēšanu no 5-10 sekundēm uz atskaites audio, padarot to ideāli piemērotu reālu sarunu un rakstura balsi radīšanai.

Galvenās iezīmes

Dialoga ģenerēšana

Radīt dabas multi-speak sarunas ar atšķirīgām balsīm un pagrieziena.

Neverbālās skaņas

Pievienojiet [smejas], [sejas], [smagas], (smadzenes) dabiskai paralingvistiskai izteiksmei.

Balss klonēšana

Apklājiet jebkuru balsi no 5-10 sekundes atsauces audio personalizētu runu.

Dabas sarunas

1.6B parametri rada ļoti dabisku saruna prozodi un intonāciju.

Lietot gadījumus

Dialogs un sarunu paaudze Audiobook ražošana ar vairākām zīmēm Spēles varoņu balsis Podraide un satura radīšana

Kā lietot Dia

1

Pierakstīties bez maksas vai atvērt demo

Izveidot bezmaksas TextToSpeechAI kontu pieprasīt savu sākumsarakstu kredītu, vai atvērt bez paraksta demo, lai mēģinātu Dia dialogs uzreiz.
2

Izvēlieties Dia motoru

TTS panelī Dia izvēlas no motoru saraksta. Dia ir uz dialogu orientēts, īpaši kvalitatīvs modelis ar daudzslāņu un balss klanēšanas atbalstu.
3

Rakstīt dialoga skriptu ar tagiem

Sarunu var veidot, izmantojot [S1] un [S2], lai atzīmētu katru runātāju pagriezienu, un nometot neverbālās atzīmes, piemēram, [smejas], [smadzenes], [smadzenes] vai (smadzenes), kur vēlaties dabiskas reakcijas.
4

Ģenerēt audio

Noklikšķiniet, lai nosūtītu Dia skriptu uz mūsu hosting GPUs. Dia padara divu skaļruņu dialogu ar pagrieziena un jūsu neverbālā tags vienā audio failā.
5

Lejupielādēt vai izsaukt API

Lejupielādēt pabeigto dialogu jūsu izvēlētajā formātā, vai automatizēt to, ievietojot to pašu [S1]/[S2] skriptu TextToSpeechAI API ar savu kontu žetonu.

Dia API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] Sveiks! Kā tu šodien esi? [Smejas] [S2] Es daru lielu, paldies par jautāšanu!",
    "voice": "en_US-lessac-medium"
  }'

Izlasiet API dokumentus Iegūstiet API atslēgu

Bieži uzdoti jautājumi

Dia ir 1.6B parametru, uz dialogu orientēts, Nari Labs teksta-uz-spīles modelis. Tā specializējas dabas saruna runu radīšanā ar atbalstu vairākiem skaļruņiem, nonverbālām skaņām un balss klonēšanai.

Jā, Dia ir pilnīgi Apache 2.0 licencēts - gan kods, gan modeļa svars. To var brīvi izmantot komerciālos lietojumos.

Šobrīd Dia atbalsta tikai angļu valodu. Modelis ir optimizēts dabiskai angļu valodas saruna runai.

Dia requires approximately 10GB of VRAM for its 1.6B parameter model. A GPU with at least 12GB is recommended for comfortable operation. On TextToSpeechAI all of this runs on our hosted GPUs, so you do not need any hardware of your own.

Jā - dialogs ir tieši par ko tiek veidota Dia. Mainot [S1] un [S2] jūsu skriptā, Dia TTS rada plūstošu divu skaļruņu sarunu ar atšķirīgām balsīm un reālistisku pagrieziena uztveri, ko ir grūtāk sasniegt ar vienreja TTS modeļiem.

Katra skripta rinda tiek apzīmēta ar [S1] vai [S2], lai atzīmētu, kas runā. Dia piešķir katrai tagai konsekventu balsi un pārslēdz starp tiem, sarunai kustoties, tāpēc [S1] un [S2] darbojas kā divas rakstzīmes jūsu dialogā.

Dia atbalsta balss klonēšanu no aptuveni 5-10 sekundēm tīras atsauces audio, ļaujot izmantot īpašu balsi skaļrunim. Varat apvienot klonēšanu ar [S1]/[S2] tagiem, lai katrs rakstzīme dialogā izklausītos kā klonētā balss.

Dia [smejas], [smajas], [smadzenes] un (smadzenes] izliek kā dabiskas paralingvistiskas skaņas, kas ievilktas runā, nevis runā. Novietojiet tagu, kur vēlaties reakciju, piemēram, "[smejas] Tas ir ļoti daiļrunīgi," lai dialogs kļūtu daudz cilvēkīgāks.

Gan Dia, gan Bark atbalsta ekspresīvas nonverbal skaņas, bet Dia ir veidota vairāku skaļruņu dialogam ar [S1]/[S2] pagrieziena un balss klonēšanu. Izvēlies Dia reālistiskām divu personu sarunām un rakstura darbam; Barks ir labāk piemērots, ja jums nepieciešams plašāks valodas pārklājums vienā balsī.

Dia ir īpaši augsta līmeņa motors, tāpēc tas maksā 50 kredītus uz 1000 rakstzīmēm ģenerētās runas. ultra līmenis atspoguļo lielāku 1.6B modeli un ~10GB GPU atmiņas, ko izmanto augstas kvalitātes dialogam.

Jā. Jauni TextToSpeechAI konti ietver bezmaksas startera kredītus, un ir demo jūs varat darboties bez reģistrācijas. Tas ir pietiekami, lai radītu īsu Dia dialogu ar [S1]/[S2] tagus pirms lemjot par apmaksātu plānu.

Jā. Kad jums ir API žetons no sava konta lapas, varat iesniegt Dia dialoga skriptus - tostarp [S1]/[S2] pagriež un tagus, piemēram [smejas] - uz TextToSpeechAI REST API un lejupielādējiet iegūto audio programmēti.

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 1
GPU VRAM 10GB
Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

Dia

Par Dia

Galvenās iezīmes

Dialoga ģenerēšana

Neverbālās skaņas

Balss klonēšana

Dabas sarunas

Lietot gadījumus

Kā lietot Dia

Pierakstīties bez maksas vai atvērt demo

Izvēlieties Dia motoru

Rakstīt dialoga skriptu ar tagiem

Ģenerēt audio

Lejupielādēt vai izsaukt API

Dia API

Bieži uzdoti jautājumi

Kas ir Dia TTS?

Vai Dia var izmantot komerciāli?

Kādas valodas Dia atbalsta?

Cik daudz GPU atmiņas Dia ir nepieciešams?

Vai Dia var veidot dialogu starp vairākām rakstzīmēm?

Kā Dia skaļrunis atzīmē [S1] un [S2]?

Vai Dia klonē balsis?

Kā Dia izklausās neverbaliskas zīmes, piemēram, [smejas] un [svaigi]?

Dia vs Bark: ko man izmantot?

Cik daudz kredītu Dia izmaksā TextToSpeechAI?

Vai es varu mēģināt Dia TTS par brīvu?

Vai es varu izmantot Dia caur TextToSpeechAI API?

Technical Specs

Try Dia Now

Other TTS Engines

miza

Tērzēšanas kaste

Mājīga vējš2color