Dia

Ultra

Dijaloški orijentirani TTS s kloniranjem glasa i neverbalnim zvukovima

Pokušaj slobodno Dia Pregledaj glasove (0)

Medium Brzina

Excellent Kvaliteta

-Da. Kloniranje

1 Jezici

O Dia

Dia by Nari Labs je parametar 1.6B dijalog-focused text-to-speech model. Ona je izvrsna na generiranju prirodnog razgovora govor uz podršku za neverbalne zvukove poput smijeha, uzdiše i kašalj. Dia podržava višezvočnik dijaloga i kloniranje glasa od 5-10 sekundi referentnog audio, što ga čini idealnim za stvaranje realnih razgovora i karakternih glasova.

Ključne osobine

Dijaloški prozor

Generirati prirodne multi-zvučni razgovori s različitim glasovima i okretanjem.

Neverbalni zvukovi

Dodaj [smijeh], [uzdiše], [kašlja], (bori) za prirodni paralinguistički izraz.

Kloniranje glasa

Kloniraj bilo koji glas iz 5-10 sekundi referentnog zvuka za personalizirani govor.

Prirodni razgovor

1.6B parametri proizvode vrlo prirodnu konverzaciju i intonaciju.

Slučaji korištenja

Dijalog i stvaranje razgovora Proizvodnja audio knjiga s više znakova Znakovni glasovi igre Kreiranje podemitara i sadržaja

Kako koristiti Dia

1

Prijavite se besplatno ili otvorite demo

Napravite besplatni TextToSpeechAI račun za zahtjev za početne kredite, ili otvorite demo za ne-signup da biste odmah pokušali Dia dijalog.
2

Odaberite Dia motor

U TTS panelu odaberite Dia sa popisa motora. Dia je dijalog-orijentirani, ultra-tier model s višezvučnikom i glasovno-kloniranje podršku.
3

Napiši dijalog skriptu s oznakama

Sastavite svoj razgovor koristeći [S1] i [S2] za označavanje svakog govornika okretanje, i ispustite u neverbalne oznake kao što su [smijeh], [uzdiše], [kašalj], ili (gasps) gdje želite prirodne reakcije.
4

Generiraj zvuk

Kliknite generirati za slanje Dia skripte na naš domaćin GPUs. Dia prikazuje dvozvučni dijalog s turn-uuzimanje i vaše neverbalne oznake u jednu zvučnu datoteku.
5

Preuzmi ili pozovi API

Preuzmite završetak dijaloga u odabranim formatu, ili ga automatizirajte objavljivanjem iste [S1]/[S2] skripte na TextToSpeechAI API s vašim žetonom računa.

Dia API

Generiraj govor programski koristeći TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kako si danas?",
    "voice": "en_US-lessac-medium"
  }'

Pročitajte API Docs Uzmite svoj API ključ

Česta pitanja

Dia je parametar 1.6B dijalog-orijentirani tekst-to-speech model iz Nari Labs. Specijalizira se za stvaranje prirodnog razgovora govora uz podršku više govornika, neverbalnih zvukova i kloniranja glasa.

Da, Dia je potpuno Apače 2.0 licencirano - i kod i model težine. Može se slobodno koristiti u komercijalnih aplikacija.

Trenutno Dia podržava samo engleski. Model je optimiziran za prirodni engleski razgovor govor.

Dia zahtijeva oko 10GB VRAM za svoj model parametara 1.6B. GPU s barem 12GB preporučuje se za udobno radno mjesto. Na TextToSpeechAI sve to radi na našim domaćim GPU-ovima, tako da ne trebate nikakvu svoju hardver.

Da - dijalog je upravo ono za što je izgrađena Dia. Naizmjeničnim [S1] i [S2] okreta u vašem scenariju, Dia TTS proizvodi tekući dvozvučni razgovor s različitim glasovima i realnim okretanjem, što je teže postići s modelima jednozvočnika TTS.

Prefiksirajte svaki redak vašeg skripte [S1] ili [S2] da označite tko govori. Dia dodjeljuje dosljedan glas svakom tag i prekidač između njih dok se razgovor kreće, tako da [S1] i [S2] djeluju kao dva znaka u vašem dijalogu.

Dia podržava kloniranje glasa od otprilike 5-10 sekundi čistog referentnog zvuka, omogućava vam da ponovo iskoristite određeni glas za zvučnik. Možete kombinirati kloniranje s oznakama [S1]/[S2] tako da svaki znak u dijalogu zvuči kao glas koji ste klonirali.

Dia je umetnuta u govoru, a ne u govoru. Postavite oznaku gdje želite reakciju, na primjer "[S1] To je smiješno [smijeh]" da se dijalog osjeća više ljudskim.

I Dia i Bark podupruju ekspresivne neverbalne zvukove, ali Dia je svrha-izgrađen za multi-zvučni dijalog s [S1] / [S2] okretanje i kloniranje glasa. Odaberite Dia za realne dvoosobne razgovore i karakter rad; Bark je bolje odgovara kada trebate šire jezičke pokrivenosti u jednoglasnom priopćenju.

Dia je ultra-tije motor, tako da košta 50 kredita na 1.000 znakova generiranog govora. Ultra etaža odražava veći 1,6B model i ~10GB GPU memorije koja koristi za kvalitetni dijalog.

Da. Novi TextToSpeechAI računa uključuju besplatne starter kredite, a postoji demo možete pokrenuti bez prijave. To je dovoljno za generiranje kratko Dia dijalog s [S1] / [S2] oznake prije nego što odlučite o plaćenom planu.

Da. Nakon što imate API žeton sa vaše stranice računa možete podnijeti Dia dijalog skripte - uključujući [S1] / [S2] okreće i oznake poput [smijeh] - na TextToSpeechAI REST API i preuzeti rezultat audio programski.

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 1
GPU VRAM 10GB
Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

Dia

O Dia

Ključne osobine

Dijaloški prozor

Neverbalni zvukovi

Kloniranje glasa

Prirodni razgovor

Slučaji korištenja

Kako koristiti Dia

Prijavite se besplatno ili otvorite demo

Odaberite Dia motor

Napiši dijalog skriptu s oznakama

Generiraj zvuk

Preuzmi ili pozovi API

Dia API

Česta pitanja

Što je Dia TTS?

Je li Dia slobodna za komercijalne usluge?

Koje jezike Dia podržava?

Koliko GPU memorije Dia treba?

Može li Dia generirati dijalog između više znakova?

Kako Dia zvučnike [S1] i [S2] djeluju?

Da li Dia klon glasove?

Kako neverbalne oznake kao [smijeh] i [uzdiše] zvuči u Dia?

Dia protiv Barka: što da koristim?

Koliko kredita Dia košta TextToSpeechAI?

Mogu li pokušati Dia TTS besplatno?

Mogu li koristiti Dia kroz TextToSpeechAI API?

Technical Specs

Try Dia Now

Other TTS Engines

Lajanje

Kutija za razgovor

Udoban glasnik2