CosyVoice2
PremiumStream dəstəkli çoxdilli səs klonlaşdırması
Bağlan CosyVoice2
CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.
Xüsusiyyətlər
Zero-Shot səs klonlama
3-10 saniyədən çox olmayan səsi yüksək keyfiyyətli səslə klonla.
Çoxdilli
Çin, ingilis, yapon, koreya və kanton dillərini dəstəkləyir.
Dağıtım dəstəyi
Real vaxt tətbiqləri və interaktiv sistemlər üçün aşağı-gecikmə axın modu.
Təbii Prozodiya
Advanced prosody modeling natural-sound speech with appropriate intonation istehsal edir.
İstifadə halları
Necə istifadə edilməlidir CosyVoice2
-
1
Qeyd olun və pulsuz kreditlər əldə edin
Başlanğıc kreditlərinizi tələb etmək üçün pulsuz TextToSpeechAI hesabını yaradın, ya da əvvəlcə demonu sınayın. GPU və ya yerli CosyVoice2 quraşdırılması lazım deyil - hər şey bizim infrastrukturumuzda işləyir.
-
2
CosyVoice2 seçin və istinad klipini əlavə edin
CosyVoice2-ni motor olaraq seçin, sonra klon etmək istədiyiniz səsin 3-10 saniyəlik təmizlənmiş qeydini yükləyin. CosyVoice2 çoxdilli klonlaşdırma üçün səsverən xassələrini çıxaracaq.
-
3
İstifadə olunan dildə mətni daxil edin
Çincə, ingiliscə, yaponca, koreyaca və ya kantonca skriptinizi yazın və ya yapışdırın. CosyVoice2 dillərarası sintezini dəstəkləyir, buna görə də klon səsi istinad klipindən fərqli bir dildə danışa bilər.
-
4
Sənəd yaradılır
CosyVoice2 qısa mətn üçün saniyələr ərzində təbii, çoxdilli səsi sintez edir. Premium səviyyəsi 1000 simvol üçün 25 kreditə başa gəlir.
-
5
API yüklə və ya istifadə et
Son audionu MP3 və ya WAV olaraq keçmişinizdən yükləyin, ya da TextToSpeechAI REST API vasitəsilə CosyVoice2 səs klonlaşdırmasını avtomatlaşdırın.
CosyVoice2 API
TextToSpeechAI REST API-ni istifadə edərək proqramlaşdırma yolu ilə danışığı yarada bilərsiniz.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2, zərrə\u002Dşot səs klonlama qabiliyyəti ilə təbii çoxdilli danışığı təmin edir.",
"voice": "en_US-lessac-medium"
}'
Tez-tez Sorulan Sual
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25