CosyVoice2
PremiumNull-shot mitmekeelne hääl kloonimine koos streaming toetust
Info CosyVoice2
CosyVoice2 on järgmise põlvkonna kõnesünteesi mudel FuAnadioLLM (Alibaba). See pakub loomulik null-shot hääl kloonimine üle mitme keele streaming võime madala-latents rakendusi. Ehitatud piiratud skalaar kvantization lähenemine, see saavutab suurepärase hääle sarnasuse vaid paar sekundit etalon heli.
Peamised omadused
Nullkuum hääl kloonimine
Kloon iga hääl alates 3-10 sekundit viide heli kõrge truudus.
Mitmekeelne
Toetab hiina, inglise, jaapani, korea ja kantoni keelelist sünteesi.
Streaming Support
Low-latency streaming režiim reaalajas rakendusi ja interaktiivseid süsteeme.
Natural Prosody
Täiustatud prosoodia modelleerimine tekitab loomuliku kõlava kõne sobiva intonatsiooniga.
Kasutusklassid
Kuidas kasutada CosyVoice2
-
1
Registreeru ja taotle tasuta krediiti
Loo tasuta TextToSpeechAI konto nõuda oma starter krediiti, või proovige demo esimene. Nr GPU või kohalik CosyVoice2 install on vaja - kõik töötab meie infrastruktuuri.
-
2
Vali CosyVoice2 ja lisa viiteklipp
Valige oma mootoriks CosyVoice2, siis laadige üles puhas 3-10 teine viide heli soovite kloonida. CosyVoice2 eemaldab kõlari omadused null-shot mitmekeelne kloonimine.
-
3
Sisesta tekst mis tahes toetatud keeles
Kirjuta või kleebi oma skript hiina, inglise, jaapani, korea või kantoni keeles. CosyVoice2 toetab keeleülest sünteesi, nii et kloonitud hääl võib rääkida keel erinev viide klipp.
-
4
Kõne genereerimine
Klõpsake genereerida ja CosyVoice2 sünteesib loomulik, mitmekeelne kõne kloonitud hääl, tavaliselt sekundite jooksul lühikese teksti. Premium-tier kasutamine maksab 25 krediiti 1000 tähemärki.
-
5
API allalaadimine või kasutamine
Laadige valmis heli nagu MP3 või WAV oma ajaloost, või automate CosyVoice2 hääl kloonimine skaalal läbi TextToSpeechAI REST API.
CosyVoice2 API
Loo kõne programmiliselt kasutades TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 pakub loomulikku mitmekeelset kõnet nullkuuma hääle kloonimise võimega.",
"voice": "en_US-lessac-medium"
}'
Korduma kippuvad küsimused
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25