Күн
UltraДиалогқа бағытталған, дауысты клондау және сөзсіз дыбыстармен TTSName
& Бұл туралы Күн
ing the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that is designed for the most complex texts.
Басты мүмкіндіктері
Диалогты құру
Көптеген елдерде латын графикасы негізінде жазылған тілдер мен диалектілер бар.
Сөйлемдегі дыбыстар
Табиғи паралингвистикалық өрнектер үшін [лаughs], [sighs], [coughs], (gasps) қосыңыз.
Дыбыс тұқымдауы
5-10 секундтық аудиодан кез келген дыбысты жеке дыбыс үшін клондау.
Табиғи әңгіме
1.6B параметрлері өте табиғи сөйлесу прозодиясын, интонациясын береді.
Пайдалану жағдайлары
Пайдалануы Күн
-
1
Тегін тіркеліңіз немесе демоны ашыңыз
Бастапқы кредиттеріңізді алу үшін тегін TextToSpeechAI тіркелгісін құрыңыз, немесе тіркеусіз демоны ашыңыз да Dia диалогын бірден сынап көріңіз.
-
2
Dia тетігін таңдау
Тіл- жазу панелінде тетіктер тізімінен Dia дегенді таңдаңыз. Dia - диалогқа бағытталған, көп дыбыс шығарғышты және дауысты клондауды қолдайтын жоғары деңгейлі модель.
-
3
Тегтермен диалог скриптін жазу
Сөйлесуді [S1] және [S2] пернелер тіркесімі арқылы әрбір сөйлеушінің кезегін белгілеп, сөзсіз тегтерді, мысалы, [лаughs], [sighs], [coughs], немесе (gasps) дегендерді, табиғи реакцияны қалаған жеріңізге түсіріңіз.
-
4
Дыбыс файлын құру
Dia скриптіңізді хосттағы графикалық процессорларға жіберу үшін Құру дегенді басыңыз. Dia екі дыбыс шығарушы диалогын, сонымен қатар сіздің сөзсіз тегтеріңізді бір аудио файлға аударады.
-
5
API жүктеп алу не шақыру
Диалогты таңдаған пішімінде жүктеп алу, немесе оны автоматты түрде TextToSpeechAI API- ге [S1] / [S2] скриптін тіркелгі белгісімен жіберу арқылы автоматтандыру.
Күн API
TextToSpeechAI REST API-мен бағдарламалық түрде сөйлеуді құру.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Сәлем! Бүгін қалайсыз? [күледі] [S2] Мен жақсымын, сұрағаныңызға рахмет!",
"voice": "en_US-lessac-medium"
}'
Жиі қойылатын сұрақтар
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50