CosyVoice2

Premium

Stream dəstəkli çoxdilli səs klonlaşdırması

Fast Sür'ət
Very Good Keyfiyyət
Bəli Köçür
5 Dillər

Bağlan CosyVoice2

CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.

Xüsusiyyətlər

Zero-Shot səs klonlama

3-10 saniyədən çox olmayan səsi yüksək keyfiyyətli səslə klonla.

Çoxdilli

Çin, ingilis, yapon, koreya və kanton dillərini dəstəkləyir.

Dağıtım dəstəyi

Real vaxt tətbiqləri və interaktiv sistemlər üçün aşağı-gecikmə axın modu.

Təbii Prozodiya

Advanced prosody modeling natural-sound speech with appropriate intonation istehsal edir.

İstifadə halları

Bir çox dildə məzmun yaratmaq Rəsmi səs köməkçiləri Dilli dublaj Özəl səs proqramları

Necə istifadə edilməlidir CosyVoice2

  1. 1

    Qeyd olun və pulsuz kreditlər əldə edin

    Başlanğıc kreditlərinizi tələb etmək üçün pulsuz TextToSpeechAI hesabını yaradın, ya da əvvəlcə demonu sınayın. GPU və ya yerli CosyVoice2 quraşdırılması lazım deyil - hər şey bizim infrastrukturumuzda işləyir.

  2. 2

    CosyVoice2 seçin və istinad klipini əlavə edin

    CosyVoice2-ni motor olaraq seçin, sonra klon etmək istədiyiniz səsin 3-10 saniyəlik təmizlənmiş qeydini yükləyin. CosyVoice2 çoxdilli klonlaşdırma üçün səsverən xassələrini çıxaracaq.

  3. 3

    İstifadə olunan dildə mətni daxil edin

    Çincə, ingiliscə, yaponca, koreyaca və ya kantonca skriptinizi yazın və ya yapışdırın. CosyVoice2 dillərarası sintezini dəstəkləyir, buna görə də klon səsi istinad klipindən fərqli bir dildə danışa bilər.

  4. 4

    Sənəd yaradılır

    CosyVoice2 qısa mətn üçün saniyələr ərzində təbii, çoxdilli səsi sintez edir. Premium səviyyəsi 1000 simvol üçün 25 kreditə başa gəlir.

  5. 5

    API yüklə və ya istifadə et

    Son audionu MP3 və ya WAV olaraq keçmişinizdən yükləyin, ya da TextToSpeechAI REST API vasitəsilə CosyVoice2 səs klonlaşdırmasını avtomatlaşdırın.

CosyVoice2 API

TextToSpeechAI REST API-ni istifadə edərək proqramlaşdırma yolu ilə danışığı yarada bilərsiniz.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2, zərrə\u002Dşot səs klonlama qabiliyyəti ilə təbii çoxdilli danışığı təmin edir.",
    "voice": "en_US-lessac-medium"
  }'

Tez-tez Sorulan Sual

CosyVoice2 FunAudioLLM (Alibaba) tərəfindən hazırlanmış yeni nəsil mətn-söhbətə və səs klonlama modelidir. O, yalnız bir neçə saniyəlik istinad səsindən zero-shot səs klonlamasını dəstəkləyir və Çin, İngilis, Yapon, Koreya və Kanton dillərində təbii səsi sintez edə bilir. TextToSpeechAI-də CosyVoice2-ni heç bir yerli qurğu olmadan brauzerdə işlədə bilərsiniz.

Bəli, CosyVoice2 Apache 2.0 lisenziyasına tam uyğundur - həm kodu, həm də model ağırlığı. Bu onu kommersiya məhsullarında, ödənişli məzmunda və lisenziyalı və ya kommersiya olmayan məhdudiyyətlər olmadan müştəri işlərində istifadə etmək üçün təhlükəsiz edir.

CosyVoice2 beş dil dəstəkləyir: Çincə (Mandarin), İngilis, Yapon, Koreya və Kanton. O həmçinin dillərarası sintezini idarə edir, buna görə də siz bir dildə qeyd olunmuş səsi klonlaya və digər dildə səsi yaratmağa bilərsiniz.

Məqsəd səsvermənin 3-10 saniyəlik təmiz referans səsini təmin edir. CosyVoice2 sonlu skalar kvantlaşdırma metodu ilə səsvermənin xüsusiyyətlərini çıxarır, sonra da dəstəklənən dillərdən hər hansı birində bu klon səslə yeni bir səs yaradır. Heç bir model təlimi və ya yaxşılaşdırma tələb olunmur.

CosyVoice2 çoxdilli klonlama modellərindən biridir, hətta istinad klipindən fərqli bir dildə səs yaratmaqla danışanın kimliyini qoruyur. Təbii prozodiya və intonasiya yaradır, bu da onu dillərarası dublaj və yerli məzmuna uyğun edir.

Bəli. CosyVoice2 sürətli bir modeldir və səs köməkçiləri və interaktiv tətbiqlər üçün uyğun olan aşağı gecikmə ilə səs istehsal edən axın modunu ehtiva edir. TextToSpeechAI-də qısa mətn üçün seanslar ərzində yaradılır.

CosyVoice2 0.5B parametr modeli üçün 4-6GB VRAM tələb edir, buna görə də öz-özünə hostinq zamanı 6GB və ya daha çox GPU məsləhət görülür. TextToSpeechAI-də model GPU infrastrukturunda işləyir, buna görə də öz hardverinə ehtiyacınız yoxdur.

CosyVoice2 premium səviyyəli modeldir və 1000 mətn xarakteri üçün 25 kreditə başa gəlir. Hər yeni hesab pulsuz kreditlər alır, buna görə də ödənişli planı seçmədən əvvəl CosyVoice2 səs klonlaşdırmasını sınaya bilərsiniz.

Hər ikisi də premium səs klonlama motorlarıdır. GPT-SoVITS tez-tez tək məqsəd səs üçün ən yüksək xam oxşarlığa çatır, CosyVoice2 isə çox dil və dillərarası klonlama üçün daha güclüdür və aşağı gecikmə axını modunu əlavə edir. Bir çox dildə danışmaq üçün tək klon səsə ehtiyacınız olduğunda CosyVoice2 seçin.

Hər ikisi də yüksək keyfiyyətli səs klonlaşdırmasını təklif edir. CosyVoice2 daha çox dil dəstəkləyir (5 vs 2) və real vaxt istifadəsi üçün axın əlavə edir, F5-TTS isə yalnız ingiliscə iş yükləri üçün bir az daha sürətli ola bilər. Çox dilli layihələr üçün CosyVoice2 adətən daha yaxşı uyğun gəlir.

TextToSpeechAI sizə MP3 və WAV kimi ümumi formatlarda CosyVoice2 nəsillərini ixrac etməyə imkan verir. Siz faylları keçmiş səhifəsindən doğrudan yükləyə və ya TextToSpeechAI API vasitəsilə proqramlaşdırma yolu ilə əldə edə bilərsiniz.

Bəli. CosyVoice2-ni pulsuz demo ilə və pulsuz başlanğıc kreditləri ilə heç bir şey quraşdırmadan TextToSpeechAI-də sınaya bilərsiniz. Yalnız qeyd olun, qısa bir istinad klipini yükləyin, dəstəklənən hər hansı bir dildə mətninizi yazın və yarada bilərsiniz.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try CosyVoice2 Now

Generate your first audio free. No credit card required.

Start Free