CosyVoice2

Premium

Null-shot mitmekeelne hääl kloonimine koos streaming toetust

Fast Kiirus
Very Good Kvaliteet
Jah Kloonimine
5 Keeled

Info CosyVoice2

CosyVoice2 on järgmise põlvkonna kõnesünteesi mudel FuAnadioLLM (Alibaba). See pakub loomulik null-shot hääl kloonimine üle mitme keele streaming võime madala-latents rakendusi. Ehitatud piiratud skalaar kvantization lähenemine, see saavutab suurepärase hääle sarnasuse vaid paar sekundit etalon heli.

Peamised omadused

Nullkuum hääl kloonimine

Kloon iga hääl alates 3-10 sekundit viide heli kõrge truudus.

Mitmekeelne

Toetab hiina, inglise, jaapani, korea ja kantoni keelelist sünteesi.

Streaming Support

Low-latency streaming režiim reaalajas rakendusi ja interaktiivseid süsteeme.

Natural Prosody

Täiustatud prosoodia modelleerimine tekitab loomuliku kõlava kõne sobiva intonatsiooniga.

Kasutusklassid

Mitmekeelse sisu loomine Reaalajas hääleassistendid Keeleülene dubleerimine Isikupärastatud häälerakendused

Kuidas kasutada CosyVoice2

  1. 1

    Registreeru ja taotle tasuta krediiti

    Loo tasuta TextToSpeechAI konto nõuda oma starter krediiti, või proovige demo esimene. Nr GPU või kohalik CosyVoice2 install on vaja - kõik töötab meie infrastruktuuri.

  2. 2

    Vali CosyVoice2 ja lisa viiteklipp

    Valige oma mootoriks CosyVoice2, siis laadige üles puhas 3-10 teine viide heli soovite kloonida. CosyVoice2 eemaldab kõlari omadused null-shot mitmekeelne kloonimine.

  3. 3

    Sisesta tekst mis tahes toetatud keeles

    Kirjuta või kleebi oma skript hiina, inglise, jaapani, korea või kantoni keeles. CosyVoice2 toetab keeleülest sünteesi, nii et kloonitud hääl võib rääkida keel erinev viide klipp.

  4. 4

    Kõne genereerimine

    Klõpsake genereerida ja CosyVoice2 sünteesib loomulik, mitmekeelne kõne kloonitud hääl, tavaliselt sekundite jooksul lühikese teksti. Premium-tier kasutamine maksab 25 krediiti 1000 tähemärki.

  5. 5

    API allalaadimine või kasutamine

    Laadige valmis heli nagu MP3 või WAV oma ajaloost, või automate CosyVoice2 hääl kloonimine skaalal läbi TextToSpeechAI REST API.

CosyVoice2 API

Loo kõne programmiliselt kasutades TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 pakub loomulikku mitmekeelset kõnet nullkuuma hääle kloonimise võimega.",
    "voice": "en_US-lessac-medium"
  }'

Korduma kippuvad küsimused

CosyVoice2 on järgmise põlvkonna teksti kõne ja hääl kloonimise mudel FuAnadioLLM (Alibaba). See toetab nullkuuma hääl kloonimine vaid paar sekundit viide audio ja võib sünteesida loomulik kõne hiina, inglise, jaapani, korea ja kantonese. TextToSpeechAI saate käivitada CosyVoice2 brauseris ilma kohaliku setup.

Jah, CosyVoice2 on täielikult Apache 2.0 litsentseeritud - nii koodi ja mudeli kaal. See muudab ohutuks kasutada kommertstoodetes, tasustatud sisu ja kliendi tööd ilma litsentsimistasusid või mitte-ärilisi piiranguid.

CosyVoice2 toetab viit keelt: hiina (mandariin), inglise, jaapani, korea ja kantoni keel. Samuti tegeleb keeleülene süntees, nii et saate kloonida hääl salvestus ühes keeles ja luua kõne teises.

Anda 3-10 sekundit puhas viide heli sihtkõlar. CosyVoice2 ekstraktid kõlar omadused kasutades piiratud skalaar quantization lähenemine, siis tekitab uue kõne, et kloonitud hääl üle ühe oma toetatud keeles. Mudeli koolitus või peenhäälestus ei ole vajalik.

CosyVoice2 on üks tugevamaid mitmekeelseid kloonimismudeleid, säilitades kõlari identiteedi isegi siis, kui see tekitab kõnekeeles, mis erineb viiteklipist. See toodab loomulikku prosoodiat ja intonatsiooni, mis teeb selle hästi sobivaks keeleüleseks dubleerimiseks ja lokaliseerimiseks.

Jah. CosyVoice2 on kiire mudel ja sisaldab streaming režiimi, mis toodab heli madala latency, muutes selle sobivaks hääl assistendid ja interaktiivsed rakendused. TextToSpeechAI põlvkonda tavaliselt täita sekundit lühikese teksti.

CosyVoice2 nõuab umbes 4-6GB VRAM jaoks 0.5B parameeter mudel, nii GPU 6GB või rohkem on soovitatav, kui isehosting. Sisse TextToSpeechAI mudel töötab meie GPU infrastruktuuri, nii et sa ei vaja riistvara oma.

CosyVoice2 on premium-tier mudel ja maksab 25 krediiti 1000 tähemärki teksti. Iga uus konto saab tasuta starter krediiti, nii et võite proovida CosyVoice2 hääl kloonimine enne otsustamist tasuline plaan.

Mõlemad on premium hääl kloonimise mootorid. GPT-SoviTS sageli jõuab kõrgeima toores sarnasus ühe sihthääle, samas CosyVoice2 on tugevam mitmekeelne ja keeleülene kloonimine ja lisab madala suhtega streaming režiimi. Vali CosyVoice2, kui teil on vaja üks kloonitud hääl rääkida mitmes keeles.

Mõlemad pakuvad kvaliteetset null-shot hääl kloonimine. CosyVoice2 toetab rohkem keeli (5 versus 2) ja lisab streaming reaalajas kasutamine, samas F5-TTS võib olla veidi kiirem inglise-ainult töökoormus. Mitmekeelsete projektide CosyVoice2 on tavaliselt parem sobib.

TextToSpeechAI võimaldab teil eksportida CosyVoice2 põlvkonnad ühistes formaatides nagu MP3 ja WAV. Saate alla laadida faili otse oma ajaloo lehele või saada seda programmiliselt kaudu TextToSpeechAI API.

Jah. Võite testida CosyVoice2 tasuta demo ja oma tasuta starter krediiti TextToSpeechAI installimata midagi. Lihtsalt registreeruda, üles laadida lühike viide klipp, kirjutada oma teksti mis tahes toetatud keeles, ja genereerida.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try CosyVoice2 Now

Generate your first audio free. No credit card required.

Start Free