Zonos
UltraKloning suara ekspresif dengan emosi dan kontrol gaya
Tentang Zonos
Zonos oleh Zyphra adalah model parameter teks 1.6B untuk ekspresi teks dengan emosi dan kontrol gaya yang canggih. Ini mendukung kloning suara dari 5-30 detik referensi audio dan dapat memodulasi nada emosional dari pidato yang dihasilkan. Pilih dari emosi seperti kebahagiaan, kesedihan, kemarahan, rasa takut, kejutan, dan jijik untuk membuat audio yang sangat ekspresif dan emosional.
Fitur Kunci
Kontrol Emosi
Kendalikan emosi tutur kata: kebahagiaan, kesedihan, kemarahan, rasa takut, keheranan, jijik, dan netral.
Penuturan Suara
Kloning semua suara dari 5-30 detik dari referensi audio dengan kesetiaan yang tinggi.
Tutur Kata yang Menekspresi
parameter 1,6B menghasilkan pidato yang sangat ekspresif dengan nuansa pengiriman emosional.
Multibahasa
Mendukung bahasa Inggris, Jepang, Cina, Prancis, dan Jerman.
Gunakan Kasus
Cara Menggunakan Zonos
-
1
Mendaftar atau membuka demo
Create a free TextToSpeechAI account to get starter credits, or use the no-signup demo to try Zonos right away.
-
2
Pilih mesin Zonos
Pilih Zonos dari pemilih suara dan model. Untuk mengklon sebuah suara, unggah 5-30 detik audio referensi bersih sehingga Zonos dapat mencocokkan speaker.
-
3
Masukkan teks Anda
Zono bekerja di seluruh Inggris, Jepang, Cina, Prancis, dan Jerman.
-
4
Pilih emosi dan menghasilkan
Pilih salah satu dari tujuh emosi Zonos - emosi netral, bahagia, sedih, marah, takut, merasa jijik - lalu klik untuk menyampaikan kata - kata ekspresif dalam suasana hati itu.
-
5
Unduh atau gunakan API
Play back and download the finished audio, or call the same Zonos engine programmatically through the TextToSpeechAI REST API for automated workflows.
Zonos API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zono menghasilkan pidato ekspresif yang luar biasa dengan pengendalian emosi yang berurat berakar.",
"voice": "en_US-lessac-medium"
}'
Pertanyaan yang Sering Diajukan
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50