Кун
UltraДиалогига қаратилган TTS овозни клонлаш ва сўзсиз товушлар билан
Маълумот Кун
ing the most accurate text-to-speech results. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia is a 1.6B parameter
Ключа хусусиятлар
Диалоги яратиш
Тасвирланган овозлар ва айланма билан табиий кўп-сўзловчи суҳбатларни яратинг.
Сўзсиз товушлар
[кулади], [ҳечқиси йўқ], [йўталди], (ҳалқ тилида) табиий ифода учун қўшинг.
Товушни клонлаш
Ўзингизга мос сўзлашув учун 5-10 сониялик аудиодан ҳар қандай овозни клонлаш.
Табиий суҳбат
1.6B параметрлари жуда табиий суҳбат прозоди ва интонацияни ҳосил қилади.
Ишлатиш ҳолатлари
Қўллаш усули Кун
-
1
Бепул рўйхатдан ўтинг ёки демони очинг
Сизнинг бошланғич кредитларингизни олиш учун бепул TextToSpeechAI ҳисобни яратинг ёки Dia диалогини ҳозироқ синаш учун рўйхатдан ўтмасдан демо очинг.
-
2
Dia моторини танлаш
TTS панелида Dia'ни моторлар рўйхатидан танланг. Dia диалогга қаратилган, кўп эшиттирувчи ва овозни клонлашни қўллаб-қувватловчи ультра-даражали моделдир.
-
3
Теглар билан диалог скрипти ёзиш
Мулоқотингизни ҳар бир сўзловчининг навбатини белгилаш учун [S1] ва [S2] ни қўллаб тузинг ва [laughs], [sighs], [coughs] ёки (gasps) каби сўзсиз тегиларни ташланг, агар табиий жавобни хоҳласангиз.
-
4
Аудио яратиш
Сизнинг Dia скриптингизни бизнинг хостланган GPUларга юбориш учун яратиш тугмасини босинг. Dia иккита сўзловчининг суҳбатини айланма олиш билан ва сизнинг сўзсиз тегингизни битта аудио файлга кўрсатади.
-
5
APIни юклаб олиш ёки чақириш
Танланган форматда тугалланган диалогни юклаб олинг ёки ҳисобингиз токенини TextToSpeechAI API'га [S1]/[S2] скриптни юбориш орқали автоматлаштиринг.
Кун API
TextToSpeechAI REST API ёрдамида дастурий сўзлашув яратиш.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Салом! Бугун қандайсиз? [кулади] [S2] Мен яхши иш қиляпман, сўраганингиз учун раҳмат!",
"voice": "en_US-lessac-medium"
}'
Доимий сўраладиган саволлар
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50