CosyVoice2
PremiumZero-shot multibahasa voice clone dengan dukungan streaming
Tentang CosyVoice2
CosyVoice2 adalah model sintesis pidato generasi berikutnya dari FunAudiolLM (Aliba). Ia memberikan suara yang tidak terdengar dengan suara yang sama mengkloning berbagai bahasa dengan kemampuan streaming untuk aplikasi tingkat rendah. Dibangun pada pendekatan kuanisasi skalar yang terbatas, sehingga mencapai persamaan suara yang sempurna dengan hanya beberapa detik dari audio referensi.
Fitur Kunci
Cloning Suara Suara Suara-nol-Shot
Menduplikasikan suara apapun dari 3-10 detik dari referensi audio dengan kesetiaan yang tinggi.
Multibahasa
Mendukung Bahasa Cina, Inggris, Jepang, Korea, dan Kanton dengan sintesis lintas bahasa.
Dukungan streaming
Mode streaming rendah untuk aplikasi real-time dan sistem interaktif.
Prosody Alami
Model prosody tingkat lanjut menghasilkan pidato yang terdengar alami dengan intonasi yang sesuai.
Gunakan Kasus
Cara Menggunakan CosyVoice2
-
1
Daftar dan klaim kredit gratis
Create a free TextToSpeechAI account to claim your starter credits, or try the demo first. No GPU or local CosyVoice2 install is needed - everything runs on our infrastructure.
-
2
Pilih CosyVoice2 dan tambahkan klip referensi
Pilih CosyVoice2 sebagai mesin anda, lalu upload 3-10 detik bersih rekaman dari suara yang ingin anda kloning. CosyVoice2 akan mengekstrak karakteristik speaker untuk kloning multilingual nol-shot.
-
3
Masukkan teks Anda dalam bahasa yang didukung
Ketik atau tempelkan naskah Anda dalam bahasa Cina, Inggris, Jepang, Korea, atau Kanton.
-
4
Hasilkan pidato
Klik hasilkan dan CosyVoice2 mensintesis pidato alami multibahasa dalam suara kloning, biasanya dalam hitungan detik untuk teks pendek. Penggunaan Premium-tier menghabiskan 25 kredit per 1.000 karakter.
-
5
Unduh atau gunakan API
Download the finished audio as MP3 or WAV from your history, or automate CosyVoice2 voice cloning at scale through the TextToSpeechAI REST API.
CosyVoice2 API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 memberikan pidato multibahasa alami dengan kemampuan kloning suara nol\u002Dshot.",
"voice": "en_US-lessac-medium"
}'
Pertanyaan yang Sering Diajukan
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25