Dia

Ultra

Uz dialogu orientēti TTS ar balss klonēšanu un neverbālām skaņām

Medium Ātrums
Excellent Kvalitāte
Klonēšana
1 Valodas

Par Dia

Dia — Nari Labs ir 1.6B parametru parametrs, kas orientēts uz tekstu uz skaņas skaņas modeli. Tas ir lielisks veids, kā radīt dabisku sarunu runu ar neverbālu skaņu atbalstu, piemēram, smiekliem, smiņām un klepus. Dia atbalsta daudzslāņu dialoga un balss klonēšanu no 5-10 sekundēm uz atskaites audio, padarot to ideāli piemērotu reālu sarunu un rakstura balsi radīšanai.

Galvenās iezīmes

Dialoga ģenerēšana

Radīt dabas multi-speak sarunas ar atšķirīgām balsīm un pagrieziena.

Neverbālās skaņas

Pievienojiet [smejas], [sejas], [smagas], (smadzenes) dabiskai paralingvistiskai izteiksmei.

Balss klonēšana

Apklājiet jebkuru balsi no 5-10 sekundes atsauces audio personalizētu runu.

Dabas sarunas

1.6B parametri rada ļoti dabisku saruna prozodi un intonāciju.

Lietot gadījumus

Dialogs un sarunu paaudze Audiobook ražošana ar vairākām zīmēm Spēles varoņu balsis Podraide un satura radīšana

Kā lietot Dia

  1. 1

    Pierakstīties bez maksas vai atvērt demo

    Izveidot bezmaksas TextToSpeechAI kontu pieprasīt savu sākumsarakstu kredītu, vai atvērt bez paraksta demo, lai mēģinātu Dia dialogs uzreiz.

  2. 2

    Izvēlieties Dia motoru

    TTS panelī Dia izvēlas no motoru saraksta. Dia ir uz dialogu orientēts, īpaši kvalitatīvs modelis ar daudzslāņu un balss klanēšanas atbalstu.

  3. 3

    Rakstīt dialoga skriptu ar tagiem

    Sarunu var veidot, izmantojot [S1] un [S2], lai atzīmētu katru runātāju pagriezienu, un nometot neverbālās atzīmes, piemēram, [smejas], [smadzenes], [smadzenes] vai (smadzenes), kur vēlaties dabiskas reakcijas.

  4. 4

    Ģenerēt audio

    Noklikšķiniet, lai nosūtītu Dia skriptu uz mūsu hosting GPUs. Dia padara divu skaļruņu dialogu ar pagrieziena un jūsu neverbālā tags vienā audio failā.

  5. 5

    Lejupielādēt vai izsaukt API

    Lejupielādēt pabeigto dialogu jūsu izvēlētajā formātā, vai automatizēt to, ievietojot to pašu [S1]/[S2] skriptu TextToSpeechAI API ar savu kontu žetonu.

Dia API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] Sveiks! Kā tu šodien esi? [Smejas] [S2] Es daru lielu, paldies par jautāšanu!",
    "voice": "en_US-lessac-medium"
  }'

Bieži uzdoti jautājumi

Dia ir 1.6B parametru, uz dialogu orientēts, Nari Labs teksta-uz-spīles modelis. Tā specializējas dabas saruna runu radīšanā ar atbalstu vairākiem skaļruņiem, nonverbālām skaņām un balss klonēšanai.

Jā, Dia ir pilnīgi Apache 2.0 licencēts - gan kods, gan modeļa svars. To var brīvi izmantot komerciālos lietojumos.

Šobrīd Dia atbalsta tikai angļu valodu. Modelis ir optimizēts dabiskai angļu valodas saruna runai.

Dia requires approximately 10GB of VRAM for its 1.6B parameter model. A GPU with at least 12GB is recommended for comfortable operation. On TextToSpeechAI all of this runs on our hosted GPUs, so you do not need any hardware of your own.

Jā - dialogs ir tieši par ko tiek veidota Dia. Mainot [S1] un [S2] jūsu skriptā, Dia TTS rada plūstošu divu skaļruņu sarunu ar atšķirīgām balsīm un reālistisku pagrieziena uztveri, ko ir grūtāk sasniegt ar vienreja TTS modeļiem.

Katra skripta rinda tiek apzīmēta ar [S1] vai [S2], lai atzīmētu, kas runā. Dia piešķir katrai tagai konsekventu balsi un pārslēdz starp tiem, sarunai kustoties, tāpēc [S1] un [S2] darbojas kā divas rakstzīmes jūsu dialogā.

Dia atbalsta balss klonēšanu no aptuveni 5-10 sekundēm tīras atsauces audio, ļaujot izmantot īpašu balsi skaļrunim. Varat apvienot klonēšanu ar [S1]/[S2] tagiem, lai katrs rakstzīme dialogā izklausītos kā klonētā balss.

Dia [smejas], [smajas], [smadzenes] un (smadzenes] izliek kā dabiskas paralingvistiskas skaņas, kas ievilktas runā, nevis runā. Novietojiet tagu, kur vēlaties reakciju, piemēram, "[smejas] Tas ir ļoti daiļrunīgi," lai dialogs kļūtu daudz cilvēkīgāks.

Gan Dia, gan Bark atbalsta ekspresīvas nonverbal skaņas, bet Dia ir veidota vairāku skaļruņu dialogam ar [S1]/[S2] pagrieziena un balss klonēšanu. Izvēlies Dia reālistiskām divu personu sarunām un rakstura darbam; Barks ir labāk piemērots, ja jums nepieciešams plašāks valodas pārklājums vienā balsī.

Dia ir īpaši augsta līmeņa motors, tāpēc tas maksā 50 kredītus uz 1000 rakstzīmēm ģenerētās runas. ultra līmenis atspoguļo lielāku 1.6B modeli un ~10GB GPU atmiņas, ko izmanto augstas kvalitātes dialogam.

Jā. Jauni TextToSpeechAI konti ietver bezmaksas startera kredītus, un ir demo jūs varat darboties bez reģistrācijas. Tas ir pietiekami, lai radītu īsu Dia dialogu ar [S1]/[S2] tagus pirms lemjot par apmaksātu plānu.

Jā. Kad jums ir API žetons no sava konta lapas, varat iesniegt Dia dialoga skriptus - tostarp [S1]/[S2] pagriež un tagus, piemēram [smejas] - uz TextToSpeechAI REST API un lejupielādējiet iegūto audio programmēti.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free