дија

Ultra

Диалогски оријентисани ТТС са клонирањем гласа и невербалним звуковима

Medium Брзина
Excellent Квалитет
Да. Клонирање
1 језици

О дија

Дија од Нари Лабса је модел у дијалогу 1, 6Б. Изврсно ствара природни разговор са подршком за невербалне звуке као смех, уздахне и кашаљ. Дија подржава генерацију вишезвучног дијалога и клонирање гласа из 5- 10 секунди референтног звука, што га чини идеалним за стварање реалистичне разговоре и знаковних гласова.

Могућности кључа

Генерисање дијалога

Генерише природне мулти-звучник разговора са различитим гласовима и преокретање.

Невербални звукови

Додај [смех], [уздише], [кашаљ], (гаспс) за природни паралингвистички израз.

Гласово клонирање

Клонирајте сваки глас из 5-10 секунди референтног звука за персонализовани говор.

Природни разговор

1.6Б параметри произвођају веома природну разговорну прозију и интонацију.

Случаји коришћења

Генекција дијалога и разговора Производња аудиокњига са више знакова Знакови знакова игре Стварање подемисије и садржаја

Како користити дија

  1. 1

    Упиши се слободно или отвори демо

    Направите бесплатни TextToSpeechAI налог да тражите стартер кредите, или отворите демо да одмах покушате са Диа дијалогом.

  2. 2

    Изаберите дија мотор

    У ТТС таблој бирате Дија са списка мотора. Дија је дијалог- оријентисан, ултра- тијер модел са вишезговочничким и глас- клонирајућим подршком.

  3. 3

    Упиши дијалог скрипту са ознакама

    Саставите разговор користећи [С1] и [С2] да обележава сваки говорник окрета, и падне у невербалне ознаке као што су [смех], [уздише], [кашаљ], или (гасп где желите природне реакције.

  4. 4

    Генериши аудио

    Кликните да бисте пошаљели дија скрипту ГПУ‐ у. Дија приказује двозвучни дијалог са пребацивањем и вашим невербалним ознакама у један аудио фајл.

  5. 5

    Преузми или позови АПИ

    Преузми завршени дијалог у изабраном формату, или аутоматски га постављајући исту скрипту [S1]/[S2] на TextToSpeechAI АПИ са жетоном вашег налога.

дија АПИ

Генерише програмски говор користећи TextToSpeechAI РЕСТ АПИ.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Здраво, како си данас?",
    "voice": "en_US-lessac-medium"
  }'

често постављана питања

Дија је параметар 1, 6Б оријентисан за текст- у- говор из Нари Лабса. Специјалиста за стварање природног разговора уз подршку за више говорника, невербалне звуке и клонирање гласа.

Да, Дија је потпуно овлашћена за Апаче 2.0 - код и модел тежине.

Тренутно дија подржава само енглески. Модел је оптимизован за природни енглески разговор.

Дија захтева приближно 10ГБ ВРАМ‐ а за свој модел параметра 1, 6Б. ГПУ са најмање 12ГБ препоручује се за удобну радњу. На TextToSpeechAI све ово ради на нашим ГПУ‐ овима, тако да вам не треба ни један свој хардвер.

Да - дијалог је управо оно за шта је гради Диа. Наизменичним С1 и С2 окреће у вашем скрипти, Дија ТТС производи двозвучни разговор са различитим гласовима и реалистичким преокретом, који је теже постићи са моделима ТТС-а за једнократне говоре.

Префикс сваке линије скрипте са [S1] или [S2] да би се обележао ко говори. Дија додељује конзистентан глас свакој ознаки и прекида између њих док се разговор креће, тако да [S1] и [S2] делују као два знака у дијалогу.

Да. Дија подржава клонирање гласа од око 5- 10 секунди чистог референтног звука, омогућавајући вам да поново употребите одређени глас за звучник. Можете комбиновати клонирање са ознакама [S1]/ [S2] тако да сваки знак у дијалогу звучи као глас који сте клонирали.

Диа претвара [смех], [уздише], [кашља] и (уздаси) као природне паралингвистичке звуке уплетене у говору, а не говоре речи.

И Дија и Барк подржавају изражавајуће невербалне звуке, али је дијалог са више говорника изграђен за више говорника са [S1] / [S2] преузимањем и клонирањем гласа. Изаберите Дија за реалистичне разговоре и рад карактера са двома особама; Ларк је бољи прилагодљив када вам је потребна шира покривеност језика у приповедању једног гласа.

Дија је ултра-тијер мотор, тако да кошта 50 кредита на 1.000 знакова генерисаног говора. Ултра-тир одражава већи 1,6Б модел и ~10GB GPU меморије које користи за висококвалитетан дијалог.

Да. Нови TextToSpeechAI налога укључују бесплатне зараде, а постоји демо које можете покренути без пријаве. То је довољно за стварање кратког дијалога са ознакама [S1]/ [S2] пре него што одлучите о плаћеном плану.

Када имате АПИ торбу са странице налога, можете да поднесете дија- дијалог скрипте - укључујући [S1]/[S2] окреће и ознаке као што су [смех] - TextToSpeechAI РЕСТ АПИ и преузмете резултата од аудио програмаматично.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try дија Now

Generate your first audio free. No credit card required.

Start Free