CosyVoice2
PremiumClonarea vocală multilingvă cu semnal zero cu suport de streaming
Despre CosyVoice2
CosyVoice2 este un model de sinteză a discursului de generație următoare din FunAudioLLM (Alaba). Acesta oferă clonarea vocală cu semnal de zbor natural în mai multe limbi cu capacitate de streaming pentru aplicații de latitate scăzută. Construit pe o abordare de cuantizare scalară finită, realizează o asemănare excelentă a vocii cu doar câteva secunde de audio de referință.
Caracteristici cheie
Clonarea vocală zero-Shot
Clonează orice voce de la 3-10 secunde de audio de referinţă cu fidelitate mare.
Multilingual
Suportează chinezi, englezi, japonezi, coreeni şi cantonezi cu sinteză translingă.
Suport de fluxuri
Mod de streaming de latență redusă pentru aplicații în timp real și sisteme interactive.
Prosodie naturală
Modelarea avansată a prosodiei produce discurs natural cu intonarea corespunzătoare.
Cazuri de utilizare
Cum să utilizaţi CosyVoice2
-
1
Înregistrează și susține creditele gratuite
Creați un cont TextToSpeechAI gratuit pentru a solicita creditele de pornire, sau încercați demo primul. Nu este nevoie de instalarea locală de GPU sau CosyVoice2 - totul funcționează pe infrastructura noastră.
-
2
Selecta CosyVoice2 si adauga un clip de referinta
Alege CosyVoice2 ca motor, apoi încărca o înregistrare de 3-10 secunda de referință a vocei pe care doriți să cloneze. CosyVoice2 va extrage caracteristicile speaker pentru clonarea multilingv de zero-shot.
-
3
Introduceți textul în orice limbaj suportat
Tastați sau încolați scriptul în chinez, engleză, japoneză, coreeană sau cantoneză. CosyVoice2 suportă sinteza multilingv, astfel încât voce clonată poate vorbi o limba diferită de clipul de referință.
-
4
Generați discursul
Click genera si CosyVoice2 sintetiza discursul natural, multilingv in voce clonata, de obicei in câteva secunde pentru textul scurt. Utilizarea premium-tier coseaza 25 credite pe 1000 de caractere.
-
5
Descărcați sau folosiți API
Descarcă audioul finit ca MP3 sau WAV din istoria ta, sau automatizează clonarea vocală CosyVoice2 la scară prin API REST TextToSpeechAI.
CosyVoice2 API
Generați discursul programmatic folosind API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 oferă discurs multilingv natural cu capacitate de clonare vocală zero\u002Dshot.",
"voice": "en_US-lessac-medium"
}'
Întrebări frecvente
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25