Hann.

Ultra

Samtals-stilla TTS með rödd klónun og nonverbal hljóð

Medium Hraði
Excellent Gæði
Klóna
1 Tungumál

Um Hann.

ing a wide range of text-to-speech formats, including 16-bit, 24-bit, 48-bit, 72-bit, 128-bit, 256-bit, 512-bit, 128-bit, 16-bit, 32-bit, 64-bit, 128-bit, 16-bit, 32-bit, and 64-bit.

Lykilatriði

Byggja glugga

Búðu til náttúruleg multi-hátalara samtal með mismunandi raddir og snúa-taka.

Ómálbundin hljóð

Bæta [hlær], [ast], [hósta], (gasps) fyrir náttúrulega paralinguistic tjáningu.

Raddklóðun

Klóna hvaða rödd sem er frá 5-10 sekúndum af tilvísunarhljóði fyrir persónulega ræðu.

Náttúrulegt samtal

1.6B breytur framleiða mjög náttúrulega samtals prosody og intonation.

Nota tilfelli

Samræður og samtal kynslóð Hljóðbók framleiðsla með mörgum stöfum Leikur staf raddir Podcast og efni sköpun

Hvernig á að nota Hann.

  1. 1

    Skráðu þig ókeypis eða opnaðu kynninguna

    Búðu til ókeypis TextToSpeechAI reikning til að krefjast upphafspunkta þinna, eða opnaðu ekki skráningar kynningu til að reyna Dia samtal strax.

  2. 2

    Veldu Dia vél

    Í TTS mælaborðinu veldu Dia frá listanum yfir vélina.Dia er samtalsmiðuð, ultra-tier líkan með multi-hátalara og raddklónun stuðning.

  3. 3

    Skrifa samræðuskriftu með merkjum

    Samsett samtalið þitt með því að nota [S1] og [S2] til að merkja hverja hátalara snúa og sleppa í nonverbal merki eins og [hlær], [ast], [hósta] eða (gasps) þar sem þú vilt náttúruleg viðbrögð.

  4. 4

    Búa til hljóð

    Smelltu á Búa til til að senda Dia handritið þitt til GPU okkar. Dia gerir samtal tveggja hátalara með snúning og ómálfræðileg merki í eina hljóðskrá.

  5. 5

    Hlaða niður eða hringja í API

    Hladdu niður fullunnum samræðum á völdu sniði eða sjálfvirka það með því að senda sama [S1] / [S2] handritið í TextToSpeechAI API með reikningsmerkinu þínu.

Hann. API

Búa til ræðu forritunarlega með TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] Halló, hvernig hefurðu það í dag? [hlær] [S2] Mér gengur frábærlega, takk fyrir að spyrja!",
    "voice": "en_US-lessac-medium"
  }'

Algengar spurningar

Dia er 1.6B breytu samræðu-stilla texta-til-tal líkan frá Nari Labs.Það sérhæfir sig í að búa til náttúrulega samtals tal með stuðningi við marga hátalara, nonverbal hljóð og radd klónun.

Já, Dia er að fullu með Apache 2.0 leyfi - bæði kóða og líkan þyngd.Það má nota frjálslega í viðskiptalegum forritum.

Nú styður Dia aðeins ensku. Líkanið er bjartsýni fyrir náttúrulega ensku samtalsræðu.

Dia þarf um það bil 10GB af VRAM fyrir 1.6B breytu líkan sitt. GPU með að minnsta kosti 12GB er mælt með því að þægileg aðgerð. Á TextToSpeechAI keyrir allt þetta á okkar hýsta GPU, svo þú þarft ekki neinn vélbúnað sjálfur.

Já - samræður eru nákvæmlega það sem Dia er byggt fyrir.Með því að skipta um [S1] og [S2] snúa í handritinu þínu, Dia TTS framleiðir fljótandi tveggja hátalara samtal með sérstökum röddum og raunhæfum snúningstökum, sem er erfiðara að ná með einni hátalara TTS módel.

Setjið [S1] eða [S2] fyrir framan hverja línu í handritinu til að merkja hver er að tala. Dia úthlutar samræmdum rödd til hvers merkis og skiptir á milli þeirra þegar samtalið færist, þannig að [S1] og [S2] virka sem tveir stafir í samtalinu þínu.

Já. Dia styður raddklónun úr um það bil 5-10 sekúndum af hreinu tilvísunarhljóði, sem gerir þér kleift að endurnýta tiltekna rödd fyrir ræðumann. Þú getur sameinað klónun með [S1]/[S2] merkinu svo hver persóna í samtali hljómar eins og röddin sem þú klónaðir.

Dia gerir [hlær], [ast], [hóstar] og (gasps) sem náttúruleg paralinguistic hljóð ofið í ræðu frekar en talaðar orð.Settu merki þar sem þú vilt viðbrögð - til dæmis "[S1] Þetta er fyndið [hlær]" - til að gera samtalið líður meira mannlegt.

Bæði Dia og Bark styðja tjáningarlaus hljóð, en Dia er sérstaklega hannað fyrir fjölmiðlasamtal með [S1] / [S2] snúa og raddklónun. Veldu Dia fyrir raunhæfar tvær samtal og persónuverk; Bark er betri passa þegar þú þarft breiðari tungumálaumfjöllun í einni rödd frásögn.

Dia er ultra-tier vél, svo það kostar 50 einingar á 1.000 stafi af mynduðu ræðu.Ultra tier endurspeglar stærri 1.6B líkan og ~ 10GB af GPU minni sem það notar fyrir hágæða samtal.

Já. Nýir TextToSpeechAI reikningar innihalda ókeypis byrjunarstyrk og það er kynning sem þú getur keyrt án þess að skrá þig. Það er nóg til að búa til stutta Dia samræðu með [S1] / [S2] merki áður en þú ákveður á greiddum áætlun.

Þegar þú hefur API tákn frá reikningssíðunni þinni geturðu sent Dia samræðuforrit - þar á meðal [S1] / [S2] snúa og merki eins og [hlær] - til TextToSpeechAI REST API og hlaðið niður hljóðinu sem myndast með forritun.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Hann. Now

Generate your first audio free. No credit card required.

Start Free