Dia

Ultra

Dialoog- gedefinieerde TTS met stem kloning en nieverbale klanke

Medium Spoed
Excellent Kwaliteit
Ja Kleur SkemasCity name (optional, probably does not need a translation)
1 Tale

Aangaande Dia

Dia deur Nari Labs is 'n 1,6B parameter dialoog-geëkusde teks-na-sech model. Dit blink voort om natuurlike gespreksrede te genereer met ondersteuning vir nieverbale klanke soos gelag, sug, en hoes. Dia ondersteun multi-preser dialoog geslag en stem kloning van 5-10 sekondes van verwysing klank, wat dit ideaal maak om realistiese gesprekke en karakterstemme te skep.

Sleutelbronne

Dialoog geslag

Genereer natuurlike veelpraat gesprekke met verskillende stemme en heraanneming.

Nieverbale klanke

Voeg [lagte] by, [sakke], [skoene], (gasps) vir natuurlike paralinguistiese uitdrukking.

Stemverkleuring

Rig enige stem van 5-10 sekondes van verwysing oudio vir persoonlike spraak.

Natuurlike gesprekke

1,6B parameters produseer hoogs natuurlike gesprekspligte en intonasie.

Gebruik letterkase

Dialoog en gespreksgeslag Audioboek produksie met veelvuldige karakters Speletjie karakter stemme Podcate en inhoud skepping

Hoe om te gebruik Dia

  1. 1

    Teken gratis op of open die demo

    Create a free TextToSpeechAI account to claim your starter credits, or open the no-signup demo to try Dia dialogue right away.

  2. 2

    Kies die Dia-enjin

    In die TTS paneelbord kies Dia van die enjin lys. Dia is die dialoog-gemiddelde, ultra-ter model met multi-praater en stem-intonering ondersteuning.

  3. 3

    Skryf 'n dialoogskrip met etiket

    Skryf jou gesprek met [S1] en [S2] om elke spreker se beurt te merk, en val in nieverbale merkers soos [lagte], [sag], [skoene] of (gas) waar jy natuurlike reaksies wil hê.

  4. 4

    Genereer die oudio

    Kliek genereer na stuur jou Dia skrip na ons bediener GPUs. Dia gee die twee- praater dialoog met skakel-inbel en jou nonverbal etiket in 'n enkele oudio lêer.

  5. 5

    Laai af of bel die API

    Download the finished dialogue in your chosen format, or automate it by posting the same [S1]/[S2] script to the TextToSpeechAI API with your account token.

Dia API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hoe is jy vandag? [S2] ek doen groot, dankie dat jy gevra het!",
    "voice": "en_US-lessac-medium"
  }'

Vrae wat dikwels gevra word

Dia is 'n 168B parameter dialoog-oor duisend teks-na-sech model van Nari Labs. Dit spesialiseer daarin om natuurlike gespreksrede te genereer met ondersteuning vir veelvuldige sprekers, nieverbale klanke en stemkloning.

Ja, Dia is ten volle Apaches 2,0 gelisensieer - kode sowel as modelgewigte.'n Mens kan dit vryelik in kommersiële programme gebruik.

Tans ondersteun Dia net Engels. Die model is ideaal vir natuurlike Engelse gespreksrede.

Dia requires approximately 10GB of VRAM for its 1.6B parameter model. A GPU with at least 12GB is recommended for comfortable operation. On TextToSpeechAI all of this runs on our hosted GPUs, so you do not need any hardware of your own.

Ja - dialoog is presies waarvoor Dia gebou is. Deur [S1] af te wissel en [S2] draaie in jou skrif te maak, bring Dia TTS 'n vloeiende twee-praat met duidelike stemme en realistiese omset, wat moeiliker is om te bereik met enkel-praater TTS modelle.

Voorvoegsel elke lyn van jou skrif met [S1] of [S2] om te merk wie praat. Dia gee 'n konsekwente stem aan elke etiket en wissel tussen hulle as die gesprek beweeg, so [S1] en [S2] tree as die twee karakters in jou dialoog.

Ja. Dia ondersteun stemkloning van ongeveer 5-10 sekondes van skoon verwysing oudio, wat jou hergebruik 'n spesifieke stem vir' n spreker. Jy kan kloning kombineer met die [S1]/[S2] etiket sodat elke karakter in 'n dialoog klink soos die stem wat jy gekloon het.

Dia gee [lagte], [sigs], [bene] en (gasps) as natuurlike paralinguistiese klanke wat in die spraak geweef is eerder as woorde wat geuiter word. Plaas 'n etiket waar jy die reaksie wil hê - byvoorbeeld "S1] wat hilaries [lage] is" - om die dialoog meer mens te laat voel.

Dia sowel as Bark ondersteun uitdrukkingende nieverbale klanke, maar Dia is 'n doel gebou vir multi-preser dialoog met [S1]/ [S2] skakel en stem kloning. Kies Dia vir realistiese twee-persoon gesprekke en karakterwerk; Bark is 'n beter pas wanneer jy breër taaldekking nodig het in enkelstemme.

Dia is 'n ultra-ter masjien, so dit kos 50 krediete per 1 000 karakters van opgewekte spraak. Die ultravlak reflekteer die groter 1,6B model en die ~10GB van GPU geheue dit gebruik vir hoë-klikheid dialoog.

Yes. New TextToSpeechAI accounts include free starter credits, and there is a demo you can run without signing up. That is enough to generate a short Dia dialogue with [S1]/[S2] tags before deciding on a paid plan.

Yes. Once you have an API token from your account page you can submit Dia dialogue scripts - including [S1]/[S2] turns and tags like [laughs] - to the TextToSpeechAI REST API and download the resulting audio programmatically.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free