Күн

Ultra

Диалогу түзүлгөн TTS, үн клондоо жана сөзсүз үн менен

Medium Жылдамдык
Excellent _Качество
Ооба Клондоо
1 Тилдер

Маалымат Күн

ing the ability to generate a text-to-speech model that is 100% accurate and accurate to the 100% of the text. Dia is a 1.6B parameter text-to-speech model that is 100% accurate and accurate to the 100% of the text. Dia is a 1.6B parameter text-to-speech model that is 100% accurate and accurate to the 100% of the text

Ачкыч өзгөчөлүктөрү

Диалогду жаратуу

Көп сүйлөгөндөрдүн ортосундагы табигый сүйлөшүүлөрдү жаратыңыз, ар кандай үн менен жана алмашуу менен.

Сөзсүз үн

[лаughs], [sighs], [coughs], (gasps) табигый паралингвистикалык билдирүү үчүн кошуңуз.

Сөздү клондоо

Персонализацияланган сүйлөм үчүн 5-10 секундалык аудиону клондоо.

Табигый сүйлөшүү

1.6B параметрлери өтө табигый сүйлөшүү прозодиясын жана интонациясын жаратат.

Колдонуу мисалдары

Диалогу жана сүйлөшүүсүн генерациялоо Бир нече символдор менен аудиокитептерди чыгаруу Ойноонун каармандарынын үнү Подкаст жана мазмунду түзүү

Колдонуу Күн

  1. 1

    Бесплатно зарегистрироваться или открыть демо

    Сатып алуучу кредиттерди алуу үчүн акысыз TextToSpeechAI эсебин түзүңүз, же Dia диалогун тез эле сынап көрүү үчүн каттоосуз демону ачыңыз.

  2. 2

    Диалогдук терезенин двигатели

    TTS панелинде Диа программасын тандаңыз. Dia - бул диалогго багытталган, көп сүйлөмдүү жана үндү клондоону колдогон ультра-деңгээлдүү модель.

  3. 3

    Тегдер менен диалог скриптинин жазуу

    Сөйлөшүүнүн текстин [S1] жана [S2] баскычтарын колдонуп, ар бир сүйлөгөн адамдын кадамын белгилөө менен түзүңүз, ошондой эле сөзсүз түрдө табигый реакцияны каалаган учурда [лаух], [сигх], [кох] же (гаспс) сыяктуу сөзсүз эмес тегдерди киргизиңиз.

  4. 4

    Аудио түзүү

    Dia скриптиңизди биздин хосттогу GPUго жөнөтүү үчүн түзүү баскычын чыкылдатыңыз. Dia эки сүйлөгөн адамдын диалогун, алардын алмашуусун жана сиздин сөзсүз эмес тегдерди бир аудиофайлга айландырат.

  5. 5

    API жүктөп алуу же чакыруу

    Диалогу завершенный файл загрузить в выбранном формате или автоматизировать его путем отправки того же [S1]/[S2] сценария в TextToSpeechAI API с вашим учетным записью.

Күн API

TextToSpeechAI REST API'ни колдонуп программалык түрдө сүйлөмдү түзүү.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] Салом! Бүгүн кандайсыз? [күлүп] [S2] Менин ишиме ийгилик, сурап жатканыңызга рахмат!",
    "voice": "en_US-lessac-medium"
  }'

Кайра-кайра берилүүчү суроолор

Dia - Nari Labs компаниясынын диалогго багытталган тексттен сүйлөмгө которуу модели. Ал бир нече сүйлөгөндөрдү колдоо менен табигый сүйлөшүү сөзүн, сөзсүз үндөрү жана үн клондоосун жаратат.

Dia толук Apache 2.0 лицензиясы менен иштелип чыккан - код жана модель салмагы. Ал коммерциялык колдонмолор үчүн эркин колдонулат.

Dia учурда англис тилин гана колдойт. Модель англис тилинин табигый сүйлөмүнө ылайыкташтырылган.

Dia өзүнүн 1.6B параметр моделине болжол менен 10 ГБ VRAM талап кылат. Жакшы иштеши үчүн 12 ГБдан кем эмес GPU талап кылынат. TextToSpeechAIде бул программа биздин хосттогу GPU-да иштей алат, ошондуктан сизге жеке аппаратура керек эмес.

Да - диалог - бул Dia түзүлгөндүн өзү. Скриптиңизде [S1] жана [S2] айланууларын алмаштырып, Dia TTS эки сүйлөгөндүн ортосундагы сүйлөшүүнү, айырмаланган үн менен жана реалисттик айланууларды жаратат, бул бир сүйлөгөн TTS моделдери менен жетишүү кыйын.

Скрипттин ар бир сапына [S1] же [S2] деген сөздү кошуңуз, бул кимдин сүйлөп жатканын көрсөтөт. Dia ар бир тегге бирдей үн ыйгарат жана сүйлөшүү жүрүп жатканда алардын ортосунда өтүп турат, ошондуктан [S1] жана [S2] диалогуңуздагы эки символдой иштейт.

Да. Dia 5-10 секундалык таза аудиону клондоону колдойт, бул сиздин адис үн чыгаруучуга арналган адис үн чыгаруучуну кайрадан колдонууңузга мүмкүндүк берет. Клондоону [S1]/[S2] тегдери менен айкалыштырып, диалогдогу ар бир символду клондогон үнгө окшоштуруп уктура аласыз.

Dia [күлкү], [күңкүлдөп], [капыраак] жана (көңүлдү ооруткан) үндөрү менен сүйлөмдү жаратат. Реакцияны каалаган жерге тегди коюңуз, мисалы "[S1] Бул күлкүлүү [күлкү]" - диалогду адамга жакындатуу үчүн.

Диа жана Барк экөө тең сөзсүз түрдө сүйлөбөгөн үндү колдойт, бирок Диа [S1]/[S2] алмашуу жана үн клондоо менен көп сүйлөгөн диалог үчүн атайын иштелип чыккан. Дианы эки адамдын ортосундагы реалисттик сүйлөшүү жана персонаждын иши үчүн тандаңыз; Барк бир ооздук баяндамада кеңири тилдик чөйрөнү камтыган учурда жакшыраак.

Dia - ультра-уровневая машина, поэтому она стоит 50 кредитов за 1000 символов генерированного речи. Ультра-уровень отражает более крупную модель 1.6B и ~10 Гб памяти GPU, которую она использует для высококачественного диалога.

Да. Новые TextToSpeechAI учетные записи включают бесплатные стартовые кредиты, а также демо-версию, которую можно запустить без регистрации. Это достаточно для создания короткого диалога с [S1]/[S2] тегами до принятия решения о платном плане.

Да. Если у вас есть API-токен из вашего учетного записи, вы можете отправить диалоговые скрипт-скрипты Dia - включая [S1]/[S2] повороты и теги, такие как [laughs] - к TextToSpeechAI REST API и загрузить полученный аудиофайл программно.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Күн Now

Generate your first audio free. No credit card required.

Start Free