Dia
UltraDialog-orientasi TTS dengan suara kloning dan suara nonverbal
Tentang Dia
Dia oleh Nari Labs adalah dialog parameter 1,6B yang berfokus pada model teks-to-peech. yang lebih unggul dalam menghasilkan percakapan alami dengan dukungan untuk nonverbal terdengar seperti tawa, mendesah, dan batuk. dia mendukung dialog multi-peactor generasi dan kloning dari 5-10 detik dari audio referensi, membuatnya ideal untuk menciptakan percakapan realistis dan suara karakter.
Fitur Kunci
Generasi Dialog
Hasilkan percakapan alami multi pembicara dengan suara yang berbeda dan mengubah-mengambil.
Suara Nonverbal
Tambahkan [tertawa], [mendesah], [batuk], (Terengah-engah) untuk ekspresi paralinguistik alami.
Penuturan Suara
Menduplikasikan suara apapun dari 5-10 detik dari referensi audio untuk berbicara pribadi.
Percakapan Alam
1.6B parameter menghasilkan prosody percakapan yang sangat alami dan intonasi.
Gunakan Kasus
Cara Menggunakan Dia
-
1
Daftar bebas atau buka demo
Create a free TextToSpeechAI account to claim your starter credits, or open the no-signup demo to try Dia dialogue right away.
-
2
Pilih mesin Dia
Dalam dashboard TTS memilih Dia dari daftar mesin. dia adalah dialog-orientasi, model ultra-tier dengan multi-pebicara dan dukungan penutupan suara.
-
3
Tulis skrip dialog dengan tag
Tulis percakapan Anda menggunakan [S1] dan [S2] untuk menandai setiap speaker berputar, dan jatuhkan pada tag nonverbal seperti [tertawa], [mendesah], atau (terengah-engah) di mana Anda ingin reaksi alami.
-
4
Buat audio
Klik hasilkan untuk mengirim skrip Dia Anda ke GPUs yang diberi host kami. Dia membuat dialog dua pembicara dengan mengambil balik dan tag nonverbal Anda menjadi satu berkas audio.
-
5
Unduh atau panggil API
Download the finished dialogue in your chosen format, or automate it by posting the same [S1]/[S2] script to the TextToSpeechAI API with your account token.
Dia API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Halo, apa kabar hari ini? Terima kasih sudah bertanya!",
"voice": "en_US-lessac-medium"
}'
Pertanyaan yang Sering Diajukan
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50