Dia

Ultra

Dialoogile orienteeritud TTS häälkloonimise ja mitteverbaalsete helidega

Medium Kiirus
Excellent Kvaliteet
Jah Kloonimine
1 Keeled

Info Dia

Dia by Nari Labs on 1,6B parameeter dialoogi keskendunud teksti-kõne mudel. See on suurepärane luua loomulik vestluskõne toel mitteverbaalne kõlab nagu naer, ohkab, ja köha. Dia toetab multi-kõlar dialoogi põlvkonna ja hääl kloonimine 5-10 sekundit viide heli, muutes see ideaalne luua realistlik vestlusi ja iseloomu hääled.

Peamised omadused

Dialoogi loomine

Luua loomulik multi-kõneleja vestlusi erinevate häälte ja pöördega.

Mitteverbaalsed helid

Lisage [laughs], [ohkab], [köha], (gasps) loomulik paralingvistlik väljendus.

Hääle kloonimine

Kloon iga hääl alates 5-10 sekundit viide heli isikupärastatud kõne.

Loomulik vestlus

1.6B parameetrid tekitavad väga loomuliku vestluse prosoodia ja intonatsiooni.

Kasutusklassid

Dialoogi ja vestluse loomine Audioraamatu tootmine mitme tähemärgiga Mängu märgi hääled Podcast ja sisu loomine

Kuidas kasutada Dia

  1. 1

    Registreeru tasuta või ava demo

    Loo tasuta TextToSpeechAI konto nõuda oma starter krediiti, või avada no-signup demo proovida Dia dialoogi kohe.

  2. 2

    Diamootori valimine

    In TTS armatuurlaua valida Dia mootori nimekirja. Dia on dialoogi orienteeritud, ultra-tier mudel multi-kõlar ja hääl-kloonimine toetust.

  3. 3

    Dialoogiskripti kirjutamine siltidega

    Koosta oma vestlus kasutades [S1] ja [S2] tähistada iga kõneleja omakorda, ja tilk nonverbal sildid nagu [laughs], [ohkab], [köha] või (gasps) kus soovite loomulikke reaktsioone.

  4. 4

    Audio genereerimine

    Klõpsake genereerida saata oma Dia skript meie majutatud GPUs. Dia muudab kahe kõneleja dialoogi omakorda-võte ja oma mitteverbaalne sildid ühte helifaili.

  5. 5

    API allalaadimine või helistamine

    Lae valmis dialoog oma valitud formaadis, või automatiseerida seda postitades sama [S1] / [S2] skripti TextToSpeechAI API oma konto märgiga.

Dia API

Loo kõne programmiliselt kasutades TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tere, kuidas sul täna läheb?",
    "voice": "en_US-lessac-medium"
  }'

Korduma kippuvad küsimused

Dia on 1.6B parameeter, mis on Nari Labsi teksti-kõnele suunatud mudel. See on spetsialiseerunud loomuliku vestluskõne loomisele, toetades mitut kõnelejat, mitteverbaalset heli ja hääle kloonimist.

Jah, Dia on täielikult Apache 2.0 litsentseeritud - nii koodi kui mudeli kaal. Seda saab kasutada vabalt kommertsrakendustes.

Praegu Dia toetab ainult inglise keeles. Modell on optimeeritud loomulik inglise vestluskõne.

Dia nõuab umbes 10GB VRAM oma 1,6B parameeter mudel. GPU vähemalt 12GB on soovitatav mugav operatsioon. TextToSpeechAI kõik see töötab meie majutatud GPU, nii et sa ei vaja mingit riistvara oma.

Jah - dialoogi on täpselt see, milleks Dia on ehitatud. Vahelduva [S1] ja [S2] pöörab oma skripti, Dia TTS toodab voolav kahekõneline vestlus selgete häälte ja realistlik pöörlemine, mida on raskem saavutada ühehäälne TTS mudelid.

Iga skripti rea prefikseerimine [S1] või [S2], et märkida, kes räägib. Dia määrab igale sildile järjepideva hääle ja lülitab vestluse liikumisel nende vahel, nii et [S1] ja [S2] käituvad dialoogis kahe märgina.

Jah. Dia toetab hääle kloonimist umbes 5-10 sekundist puhtast viitehelist, mis võimaldab teil taaskasutada kõneleja jaoks konkreetset häält. Kloonimist saab kombineerida [S1]/[S2] siltidega, nii et iga tegelane kõlab dialoogis nagu hääl, mille kloonisite.

Dia tõlgib [naerab], [ohkab], [köha] ja (gasps) loomulik paralingvistlik helid kootud kõne asemel sõna. Pane silt, kus sa tahad reaktsiooni - näiteks "[S1] See on lõbus [naerab]" - teha dialoogi tunne rohkem inimese.

Dia ja Bark toetavad nii väljendusrikkaid mitteverbaalseid helisid, kuid Dia on loodud mitmekeelseks dialoogiks [S1]/[S2] pöörde ja hääle kloonimisega. Vali Dia realistlikeks kahe inimese vestlusteks ja iseloomutööks; Bark sobib paremini, kui vajad laiemat keelekasutust ühe hääle jutustamisel.

Dia on ülitihe mootor, nii et see maksab 50 krediiti 1000 tähemärgi kohta loodud kõne. Ultra tasand peegeldab suuremat 1,6B mudelit ja ~10GB GPU mälu, mida ta kasutab kvaliteetse dialoogi jaoks.

Jah. Uued TextToSpeechAI kontod sisaldavad tasuta starter krediiti, ja seal on demo saab käivitada ilma registreerumine. See on piisav, et luua lühike Dia dialoogi [S1] / [S2] sildid enne otsustamist tasuline plaan.

Jah. Kui teil on API märgi oma konto lehele saate esitada Dia dialoogi skriptid - sealhulgas [S1] / [S2] pöörded ja sildid nagu [laughs] - et TextToSpeechAI REST API ja alla laadida saadud audio programmiliselt.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free