Dia
UltraTTS dialog-orientasikan dengan klon suara dan bunyi nonverbal
Tentang Dia
ing the most accurate text-to-speech model for the 2018-2019 season. Dia is a 1.6B parameter text-to-speech model that is designed to be used in the 2018-2019 season. Dia is a 1.6B parameter text-to-speech model that is designed to be used in the 2018-2019 season.
Ciri-ciri Utama
Penjanaan Dialog
Janakan perbualan multi-penyiar semulajadi dengan suara yang berbeza dan mengambil pusingan.
Bunyi Nonverbal
Tambah [tertawa], [sesak nafas], [bersin], (berdebar-debar) untuk ungkapan paralinguistik semulajadi.
Klon Suara
Klon sebarang suara dari 5-10 saat audio rujukan untuk ucapan peribadi.
Perbualan semulajadi
Parameter 1.6B menghasilkan prosody perbualan yang sangat semula jadi dan intonasi.
Gunakan Kes
Bagaimana untuk Guna Dia
-
1
Daftar percuma atau buka demo
Cipta akaun TextToSpeechAI percuma untuk menuntut kredit pelancar anda, atau buka demo tanpa mendaftar untuk mencuba dialog Dia dengan segera.
-
2
Pilih enjin Dia
Dalam papan pemuka TTS pilih Dia dari senarai enjin. Dia adalah model bertahap tinggi, dialog-orientasikan dengan sokongan klon suara dan pembicara berbilang.
-
3
Tulis skrip dialog dengan tag
Komponen perbualan anda menggunakan [S1] dan [S2] untuk menandakan setiap pusingan pembicara, dan jatuhkan tag nonverbal seperti [laughs], [sighs], [coughs], atau (gasps) di mana anda mahu reaksi semulajadi.
-
4
Janakan audio
Klik cipta untuk menghantar skrip Dia anda ke GPU yang dihost kami. Dia mengekspresikan dialog dua-pembesar suara dengan mengambil pusingan dan tag nonverbal anda ke fail audio tunggal.
-
5
Muat turun atau panggil API
Muat turun dialog yang siap dalam format yang dipilih, atau automatikkannya dengan memuatkan skrip [S1]/[S2] yang sama ke API TextToSpeechAI dengan token akaun anda.
Dia API
Janakan ucapan secara program menggunakan API REST TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello, apa khabar hari ini?",
"voice": "en_US-lessac-medium"
}'
Soalan Lazim
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50