Күн

Ultra

Диалогқа бағытталған, дауысты клондау және сөзсіз дыбыстармен TTSName

Medium Жылдамдығы
Excellent Сапа
Иә Клондау
1 Тілдер

& Бұл туралы Күн

ing the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that is designed for the most complex texts.

Басты мүмкіндіктері

Диалогты құру

Көптеген елдерде латын графикасы негізінде жазылған тілдер мен диалектілер бар.

Сөйлемдегі дыбыстар

Табиғи паралингвистикалық өрнектер үшін [лаughs], [sighs], [coughs], (gasps) қосыңыз.

Дыбыс тұқымдауы

5-10 секундтық аудиодан кез келген дыбысты жеке дыбыс үшін клондау.

Табиғи әңгіме

1.6B параметрлері өте табиғи сөйлесу прозодиясын, интонациясын береді.

Пайдалану жағдайлары

Диалог пен әңгіме құру Бірнеше таңбадан тұратын аудиокітапты жасау Ойынның кейіпкерінің дауысы Подкаст пен мазмұнды құруName

Пайдалануы Күн

  1. 1

    Тегін тіркеліңіз немесе демоны ашыңыз

    Бастапқы кредиттеріңізді алу үшін тегін TextToSpeechAI тіркелгісін құрыңыз, немесе тіркеусіз демоны ашыңыз да Dia диалогын бірден сынап көріңіз.

  2. 2

    Dia тетігін таңдау

    Тіл- жазу панелінде тетіктер тізімінен Dia дегенді таңдаңыз. Dia - диалогқа бағытталған, көп дыбыс шығарғышты және дауысты клондауды қолдайтын жоғары деңгейлі модель.

  3. 3

    Тегтермен диалог скриптін жазу

    Сөйлесуді [S1] және [S2] пернелер тіркесімі арқылы әрбір сөйлеушінің кезегін белгілеп, сөзсіз тегтерді, мысалы, [лаughs], [sighs], [coughs], немесе (gasps) дегендерді, табиғи реакцияны қалаған жеріңізге түсіріңіз.

  4. 4

    Дыбыс файлын құру

    Dia скриптіңізді хосттағы графикалық процессорларға жіберу үшін Құру дегенді басыңыз. Dia екі дыбыс шығарушы диалогын, сонымен қатар сіздің сөзсіз тегтеріңізді бір аудио файлға аударады.

  5. 5

    API жүктеп алу не шақыру

    Диалогты таңдаған пішімінде жүктеп алу, немесе оны автоматты түрде TextToSpeechAI API- ге [S1] / [S2] скриптін тіркелгі белгісімен жіберу арқылы автоматтандыру.

Күн API

TextToSpeechAI REST API-мен бағдарламалық түрде сөйлеуді құру.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] Сәлем! Бүгін қалайсыз? [күледі] [S2] Мен жақсымын, сұрағаныңызға рахмет!",
    "voice": "en_US-lessac-medium"
  }'

Жиі қойылатын сұрақтар

Dia - Nari Labs- тің диалогқа бағытталған мәтіннен сөйлеуге 1. 6B параметрлі үлгісі. Ол бірнеше сөйлеушілерді, сөзсіз дыбыстарды және дауысты клондауды қолдайтын табиғи сөйлеу құру үшін арнайы жасалған. Name

Иә, Dia толық Apache 2. 0 лицензиясымен шығарылған - коды мен үлгісінің салмағы. Коммерциялық қолданбаларда еркін қолданылуы мүмкін.

Қазір Dia тек ағылшын тілін қолдайды. Бұл модель ағылшын тілінің табиғи сөйлеуіне бейімделеді.

Dia- ның 1. 6B параметрлік үлгісі үшін шамамен 10 ГБ VRAM қажет. Қалай жұмыс істеу керектігін білу үшін кемінде 12 ГБ графикалық процессор керек. TextToSpeechAI- да бұл барлық бағдарламалар біздің хостта орналасқан графикалық процессорларда орындалады, сондықтан сізге өзіңіздің жабдығыңыз қажет емес.

Иә - диалог - Dia- ның құрылған мақсаты. Скриптіңіздегі [S1] және [S2] ауысуларды алмастыра отырып, Dia TTS екі дыбыс шығарушы арасындағы сөйлесуді, бір дыбыс шығарушымен сөйлесуге қарағанда, бір- біріне ұқсамайтын дыбыстармен, шынайы ауысуларды жасайды.

Скриптің әрбір жолына сөйлеп жатқанын көрсету үшін [S1] не [S2] дегендерді қосыңыз. Dia әрбір тегке біркелкі дауысты белгілеп, әңгіме жүріп жатқанда олардың арасында ауысады, сондықтан [S1] мен [S2] диалогтағы екі таңба ретінде қызмет етеді.

Иә. Dia 5- 10 секундтық таза аудиодан дауысты клондауды қолдайды, бұл дыбыс шығарғышқа белгілі бір дауысты қайта пайдалануға мүмкіндік береді. Диалогта әрбір таңба клондаған дауыс сияқты болып шығу үшін [S1] / [S2] тегімен қоса қолдана аласыз.

Dia [күледі], [сүйсінеді], [төтенеді], және (жөтеледі) дегендерді сөйлеу сөздерінің орнына сөйлеудің құрамына кіретін табиғи паралингвистикалық дыбыстар ретінде көрсетеді. Диалогты адамша ету үшін, реакцияны қалайтын жерге тег қойыңыз, мысалы, "[S1] Бұл күлкілі [күледі]".

Dia мен Bark екеуі де сөйлемдегі сөзсіз дыбыстарды қолдайды, бірақ Dia көп сөйлеушілердің диалогы үшін [S1] / [S2] кезекпен сөйлеу және дауысты клондау үшін жасалған. Dia- ны екі адам арасындағы реалистік әңгіме мен кейіпкер жұмысы үшін таңдаңыз; Bark- ты бір дауыссыз баяндау үшін тілдің кең ауқымын қамтитын нұсқа ретінде таңдаңыз.

Dia - бұл ультра- деңгейлі тетігі, сондықтан ол 1000 таңбаға 50 кредитті қажет етеді. Ультра- деңгейі 1. 6B моделінің үлкендігін және жоғары сапалы диалог үшін ~10 ГБ графикалық жады қажет ететінін көрсетеді.

Иә. Жаңа TextToSpeechAI тіркелгісі тегін бастау кредиттерін қамтиды, және тіркеусіз демоны орындауға болады. Бұл төлемді жоспарды таңдамас бұрын [S1] / [S2] тегтері бар Dia диалогын жасауға жеткілікті.

Иә. Тіркелгіңіздегі API белгісі бар болса, Dia диалог скриптін - [S1] / [S2] айналымдары мен [лаughs] сияқты тегтері бар - TextToSpeechAI REST API- ге жібере аласыз да, нәтижесінде шыққан дыбысты бағдарламалық түрде жүктеп ала аласыз.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Күн Now

Generate your first audio free. No credit card required.

Start Free