Dia

Ultra

Dijaloški orijentirani TTS s kloniranjem glasa i neverbalnim zvukovima

Medium Brzina
Excellent Kvaliteta
-Da. Kloniranje
1 Jezici

O Dia

Dia by Nari Labs je parametar 1.6B dijalog-focused text-to-speech model. Ona je izvrsna na generiranju prirodnog razgovora govor uz podršku za neverbalne zvukove poput smijeha, uzdiše i kašalj. Dia podržava višezvočnik dijaloga i kloniranje glasa od 5-10 sekundi referentnog audio, što ga čini idealnim za stvaranje realnih razgovora i karakternih glasova.

Ključne osobine

Dijaloški prozor

Generirati prirodne multi-zvučni razgovori s različitim glasovima i okretanjem.

Neverbalni zvukovi

Dodaj [smijeh], [uzdiše], [kašlja], (bori) za prirodni paralinguistički izraz.

Kloniranje glasa

Kloniraj bilo koji glas iz 5-10 sekundi referentnog zvuka za personalizirani govor.

Prirodni razgovor

1.6B parametri proizvode vrlo prirodnu konverzaciju i intonaciju.

Slučaji korištenja

Dijalog i stvaranje razgovora Proizvodnja audio knjiga s više znakova Znakovni glasovi igre Kreiranje podemitara i sadržaja

Kako koristiti Dia

  1. 1

    Prijavite se besplatno ili otvorite demo

    Napravite besplatni TextToSpeechAI račun za zahtjev za početne kredite, ili otvorite demo za ne-signup da biste odmah pokušali Dia dijalog.

  2. 2

    Odaberite Dia motor

    U TTS panelu odaberite Dia sa popisa motora. Dia je dijalog-orijentirani, ultra-tier model s višezvučnikom i glasovno-kloniranje podršku.

  3. 3

    Napiši dijalog skriptu s oznakama

    Sastavite svoj razgovor koristeći [S1] i [S2] za označavanje svakog govornika okretanje, i ispustite u neverbalne oznake kao što su [smijeh], [uzdiše], [kašalj], ili (gasps) gdje želite prirodne reakcije.

  4. 4

    Generiraj zvuk

    Kliknite generirati za slanje Dia skripte na naš domaćin GPUs. Dia prikazuje dvozvučni dijalog s turn-uuzimanje i vaše neverbalne oznake u jednu zvučnu datoteku.

  5. 5

    Preuzmi ili pozovi API

    Preuzmite završetak dijaloga u odabranim formatu, ili ga automatizirajte objavljivanjem iste [S1]/[S2] skripte na TextToSpeechAI API s vašim žetonom računa.

Dia API

Generiraj govor programski koristeći TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kako si danas?",
    "voice": "en_US-lessac-medium"
  }'

Česta pitanja

Dia je parametar 1.6B dijalog-orijentirani tekst-to-speech model iz Nari Labs. Specijalizira se za stvaranje prirodnog razgovora govora uz podršku više govornika, neverbalnih zvukova i kloniranja glasa.

Da, Dia je potpuno Apače 2.0 licencirano - i kod i model težine. Može se slobodno koristiti u komercijalnih aplikacija.

Trenutno Dia podržava samo engleski. Model je optimiziran za prirodni engleski razgovor govor.

Dia zahtijeva oko 10GB VRAM za svoj model parametara 1.6B. GPU s barem 12GB preporučuje se za udobno radno mjesto. Na TextToSpeechAI sve to radi na našim domaćim GPU-ovima, tako da ne trebate nikakvu svoju hardver.

Da - dijalog je upravo ono za što je izgrađena Dia. Naizmjeničnim [S1] i [S2] okreta u vašem scenariju, Dia TTS proizvodi tekući dvozvučni razgovor s različitim glasovima i realnim okretanjem, što je teže postići s modelima jednozvočnika TTS.

Prefiksirajte svaki redak vašeg skripte [S1] ili [S2] da označite tko govori. Dia dodjeljuje dosljedan glas svakom tag i prekidač između njih dok se razgovor kreće, tako da [S1] i [S2] djeluju kao dva znaka u vašem dijalogu.

Dia podržava kloniranje glasa od otprilike 5-10 sekundi čistog referentnog zvuka, omogućava vam da ponovo iskoristite određeni glas za zvučnik. Možete kombinirati kloniranje s oznakama [S1]/[S2] tako da svaki znak u dijalogu zvuči kao glas koji ste klonirali.

Dia je umetnuta u govoru, a ne u govoru. Postavite oznaku gdje želite reakciju, na primjer "[S1] To je smiješno [smijeh]" da se dijalog osjeća više ljudskim.

I Dia i Bark podupruju ekspresivne neverbalne zvukove, ali Dia je svrha-izgrađen za multi-zvučni dijalog s [S1] / [S2] okretanje i kloniranje glasa. Odaberite Dia za realne dvoosobne razgovore i karakter rad; Bark je bolje odgovara kada trebate šire jezičke pokrivenosti u jednoglasnom priopćenju.

Dia je ultra-tije motor, tako da košta 50 kredita na 1.000 znakova generiranog govora. Ultra etaža odražava veći 1,6B model i ~10GB GPU memorije koja koristi za kvalitetni dijalog.

Da. Novi TextToSpeechAI računa uključuju besplatne starter kredite, a postoji demo možete pokrenuti bez prijave. To je dovoljno za generiranje kratko Dia dijalog s [S1] / [S2] oznake prije nego što odlučite o plaćenom planu.

Da. Nakon što imate API žeton sa vaše stranice računa možete podnijeti Dia dijalog skripte - uključujući [S1] / [S2] okreće i oznake poput [smijeh] - na TextToSpeechAI REST API i preuzeti rezultat audio programski.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free