CosyVoice2
PremiumZero-skot fjöltyngdar raddklónun með straumspilun stuðning
Um CosyVoice2
[Translation temporarily unavailable. Please try again.]
Lykilatriði
Zero-Shot Voice Cloning
Klóna hvaða rödd frá 3-10 sekúndum af tilvísun hljóð með hár trúfesti.
Fjöltyng
Styður kínverska, enska, japönsk, kóreska og Cantonese með cross-tungumál myndun.
Stuðningur við straumspilun
Low-latency streymisstilling fyrir rauntíma forrit og gagnvirk kerfi.
Náttúruleg orðræða
Advanced prosody líkan framleiðir náttúrulega hljómandi ræðu með viðeigandi intonation.
Nota tilfelli
Hvernig á að nota CosyVoice2
-
1
Skráðu þig og krefjast ókeypis einingar
Búðu til ókeypis TextToSpeechAI reikning til að krefjast upphafspunkta þinna, eða reyndu kynninguna fyrst.Engin GPU eða staðbundin CosyVoice2 uppsetning er nauðsynleg - allt keyrir á innviði okkar.
-
2
Veldu CosyVoice2 og bæta við tilvísun bút
Veldu CosyVoice2 sem vél þína, þá hlaða hreint 3-10 sekúndna viðmiðunarupptöku af röddinni sem þú vilt klóna.CosyVoice2 mun draga hátalaraeinkenni fyrir núll-skot fjöltyngdar klónun.
-
3
Sláðu inn texta á hvaða tungumáli sem er
Sláðu inn eða líma handritið þitt á kínversku, ensku, japönsku, kóresku eða Cantonese.CosyVoice2 styður cross-tungumál myndun, þannig að klónað rödd getur talað tungumál öðruvísi en tilvísun bút.
-
4
Búa til ræðuna
Smelltu á búa til og CosyVoice2 myndar náttúrulega, fjöltyngdar ræðu í klónuðu röddinni, venjulega innan sekúndna fyrir stuttan texta. Premium-stig notkun kostar 25 einingar á 1.000 stafi.
-
5
Hlaða niður eða nota API
Hlaða niður fullunnum hljóð sem MP3 eða WAV úr sögu þinni, eða sjálfvirkt CosyVoice2 rödd klónun á mælikvarða í gegnum TextToSpeechAI REST API.
CosyVoice2 API
Búa til ræðu forritunarlega með TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 skilar náttúrulegum fjöltyngdum ræðu með núll\u002Dskot rödd klónun getu.",
"voice": "en_US-lessac-medium"
}'
Algengar spurningar
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25