CosyVoice2
PremiumKlon suara multibahasa Zero-shot dengan sokongan strim
Tentang CosyVoice2
-to-voice cloning across multiple languages with streaming capability for low-latency voice cloning. CosyVoice2 is a
Ciri-ciri Utama
Klon Suara Zero-Shot
Klon sebarang suara dari 3-10 saat audio rujukan dengan ketulenan tinggi.
Berbilang Bahasa
Sokongan Cina, Inggeris, Jepun, Korea, dan Kantonis dengan sintesis lintas-bahasa.
Sokongan Strim
Mod strim latensi rendah untuk aplikasi masa nyata dan sistem interaktif.
Prosody semulajadi
Model prosody yang canggih menghasilkan ucapan yang berbunyi semulajadi dengan intonasi yang sesuai.
Gunakan Kes
Bagaimana untuk Guna CosyVoice2
-
1
Daftar dan tuntut kredit percuma
Cipta akaun TextToSpeechAI percuma untuk menuntut kredit permulaan anda, atau cuba demo pertama. Tiada GPU atau pemasangan CosyVoice2 setempat diperlukan - semuanya berjalan pada infrastruktur kami.
-
2
Pilih CosyVoice2 dan tambah klip rujukan
Pilih CosyVoice2 sebagai enjin anda, kemudian muat naik rakaman rujukan 3-10 saat bersih suara yang anda ingin klon. CosyVoice2 akan mengekstrak ciri-ciri pembicara untuk klon multibahasa sifar-shot.
-
3
Masukkan teks anda dalam mana-mana bahasa yang disokong
Taip atau tampal skrip anda dalam bahasa Cina, Inggeris, Jepun, Korea, atau Kantonis. CosyVoice2 menyokong sintesis lintas-bahasa, jadi suara yang diklon boleh bercakap bahasa yang berbeza daripada klip rujukan.
-
4
Janakan ucapan
Klik cipta dan CosyVoice2 mensintesiskan ucapan semulajadi, berbilang bahasa dalam suara yang diklonkan, biasanya dalam masa beberapa saat untuk teks pendek. Penggunaan premium-tahap kos 25 kredit per 1,000 aksara.
-
5
Muat turun atau guna API
Muat turun audio yang siap sebagai MP3 atau WAV dari sejarah anda, atau automatik klon suara CosyVoice2 pada skala melalui API REST TextToSpeechAI.
CosyVoice2 API
Janakan ucapan secara program menggunakan API REST TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 memberikan ucapan multibahasa semulajadi dengan keupayaan klon suara sifar\u002Dtembak.",
"voice": "en_US-lessac-medium"
}'
Soalan Lazim
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25