CosyVoice2

Premium

Zero-skot fjöltyngdar raddklónun með straumspilun stuðning

Fast Hraði
Very Good Gæði
Klóna
5 Tungumál

Um CosyVoice2

[Translation temporarily unavailable. Please try again.]

Lykilatriði

Zero-Shot Voice Cloning

Klóna hvaða rödd frá 3-10 sekúndum af tilvísun hljóð með hár trúfesti.

Fjöltyng

Styður kínverska, enska, japönsk, kóreska og Cantonese með cross-tungumál myndun.

Stuðningur við straumspilun

Low-latency streymisstilling fyrir rauntíma forrit og gagnvirk kerfi.

Náttúruleg orðræða

Advanced prosody líkan framleiðir náttúrulega hljómandi ræðu með viðeigandi intonation.

Nota tilfelli

Fjöltyng efni sköpun Rauntíma radd aðstoðarmenn Cross tungumál dubbing Persónuleg raddforrit

Hvernig á að nota CosyVoice2

  1. 1

    Skráðu þig og krefjast ókeypis einingar

    Búðu til ókeypis TextToSpeechAI reikning til að krefjast upphafspunkta þinna, eða reyndu kynninguna fyrst.Engin GPU eða staðbundin CosyVoice2 uppsetning er nauðsynleg - allt keyrir á innviði okkar.

  2. 2

    Veldu CosyVoice2 og bæta við tilvísun bút

    Veldu CosyVoice2 sem vél þína, þá hlaða hreint 3-10 sekúndna viðmiðunarupptöku af röddinni sem þú vilt klóna.CosyVoice2 mun draga hátalaraeinkenni fyrir núll-skot fjöltyngdar klónun.

  3. 3

    Sláðu inn texta á hvaða tungumáli sem er

    Sláðu inn eða líma handritið þitt á kínversku, ensku, japönsku, kóresku eða Cantonese.CosyVoice2 styður cross-tungumál myndun, þannig að klónað rödd getur talað tungumál öðruvísi en tilvísun bút.

  4. 4

    Búa til ræðuna

    Smelltu á búa til og CosyVoice2 myndar náttúrulega, fjöltyngdar ræðu í klónuðu röddinni, venjulega innan sekúndna fyrir stuttan texta. Premium-stig notkun kostar 25 einingar á 1.000 stafi.

  5. 5

    Hlaða niður eða nota API

    Hlaða niður fullunnum hljóð sem MP3 eða WAV úr sögu þinni, eða sjálfvirkt CosyVoice2 rödd klónun á mælikvarða í gegnum TextToSpeechAI REST API.

CosyVoice2 API

Búa til ræðu forritunarlega með TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 skilar náttúrulegum fjöltyngdum ræðu með núll\u002Dskot rödd klónun getu.",
    "voice": "en_US-lessac-medium"
  }'

Algengar spurningar

CosyVoice2 er næstu kynslóð texta-til-tal og rödd klónun líkan frá FunAudioLLM (Alibaba). Það styður núll-skot rödd klónun frá aðeins nokkrum sekúndum af tilvísun hljóð og getur myndað náttúrulega ræðu á kínversku, ensku, japönsku, kóresku og Cantonese. Á TextToSpeechAI þú getur keyrt CosyVoice2 í vafranum án þess að setja upp staðbundið.

Já, CosyVoice2 er fullkomlega Apache 2.0 leyfi - bæði kóða og líkan þyngd.Þetta gerir það öruggt að nota í viðskiptalegum vörum, greiddum efni, og viðskiptavinur vinna án leyfisgjalda eða non-commercial takmarkanir.

CosyVoice2 styður fimm tungumál: kínverska (Mandarin), ensku, japönsku, kóresku og Cantonese.Það höndlar einnig cross-tungumál myndun, svo þú getur klóna rödd úr upptöku á einu tungumáli og búa til ræðu í öðru.

Veita 3-10 sekúndur af hreinu viðmiðunarhljóði miðhátalara. CosyVoice2 dregur út einkenni hátalara með því að nota endanlegan skammtafræðilegan nálgun og býr síðan til nýja ræðu í klónaðri rödd á einhverju af studdum tungumálum sínum. Engin líkanþjálfun eða fínstillingar er krafist.

CosyVoice2 er eitt sterkasta fjöltyngdar klónunarlíkanið og varðveitir málfarslegan auðkenni, jafnvel þegar talað er á öðru tungumáli en viðmiðunarklippið. Það framleiðir náttúrulegan orðalag og innslátt, sem gerir það vel við hæfi fyrir cross-language dubbing og staðbundið efni.

CosyVoice2 er hratt tæki og inniheldur straumspilunarstillingu sem framleiðir hljóð með litlum biðtíma, sem gerir það hentugur fyrir raddþjónustu og gagnvirk forrit. Á TextToSpeechAI kynslóðum er venjulega lokið á sekúndum fyrir stuttan texta.

CosyVoice2 þarf um 4-6GB af VRAM fyrir 0.5B breytu líkan, þannig að GPU með 6GB eða meira er mælt með því að sjálf-hýsa.Á TextToSpeechAI líkanið keyrir á GPU innviði okkar, svo þú þarft ekki neinn vélbúnað af eigin hendi.

CosyVoice2 er hágæða-stig líkan og kostar 25 einingar á 1.000 stafi texta. Sérhver nýr reikningur fær ókeypis byrjendaeiningar, svo þú getur prófað CosyVoice2 rödd klónun áður en þú ákveður á greiddum áætlun.

GPT-SoVITS nær oft hæsta hráa líkleika fyrir eina mark rödd, en CosyVoice2 er sterkari fyrir fjöltyngdar og kross-tungumál klónun og bætir við lágmarks leynd straumspilunarstillingu. Veldu CosyVoice2 þegar þú þarft eina klónuð rödd til að tala nokkur tungumál.

CosyVoice2 styður fleiri tungumál (5 á móti 2) og bætir við straumspilun fyrir rauntíma notkun, en F5-TTS getur verið örlítið hraðar fyrir ensku eingöngu vinnuálag. Fyrir fjöltyngd verkefni er CosyVoice2 venjulega betri passa.

TextToSpeechAI leyfir þér að flytja CosyVoice2 kynslóðir í algengum sniðum eins og MP3 og WAV.Þú getur hlaðið niður skránni beint frá sögusíðunni þinni eða sótt það forritunarlega í gegnum TextToSpeechAI API.

Já, þú getur prófað CosyVoice2 með ókeypis kynningu og ókeypis byrjunarpunktum þínum á TextToSpeechAI án þess að setja upp neitt. Bara skráðu þig, hlaða upp stuttu tilvísunarmyndbandi, sláðu inn textann þinn á hvaða tungumáli sem er studd og búa til.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try CosyVoice2 Now

Generate your first audio free. No credit card required.

Start Free