CosyVoice2
PremiumNollalaukauksinen monikielinen äänikloonaus suoratoistotuella
Tietoja CosyVoice2
CosyVoice2 on FunAudioLLM:n (Alibaba) seuraavan sukupolven puhesynteesimalli. Se tarjoaa luonnolta kuulostavaa nollaäänikloonausta useilla eri kielillä, ja sillä on streamauskyky matalan latenssin sovelluksiin. Se perustuu rajalliseen scalar-määrittelyyn, ja sillä saavutetaan erinomainen äänen samankaltaisuus vain muutaman sekunnin referenssiäänellä.
Tärkeimmät ominaisuudet
Nollakuuman äänen kloonaus
Kloonaa 3-10 sekunnin mittaisesta referenssiäänestä korkealla uskollisuudella.
Monikielinen
Tukee kiinaa, englantia, japania, koreaa ja kantonilaista ristikielisellä synteesillä.
Striimaustuki
Matalan latenssin suoratoistotila reaaliaikaisiin sovelluksiin ja vuorovaikutteisiin järjestelmiin.
Luonnollinen prosody
Advanced prosody -mallisto tuottaa luonnolta kuulostavaa puhetta sopivalla intonaatiolla.
Käytä tapauksia
Miten sitä käytetään CosyVoice2
-
1
Rekisteröidy ja hae ilmaisia opintopisteitä
Luo ilmainen TextToSpeechAI-tili, jolla saat starttitilisi, tai kokeile demoa ensin. Ei GPU:ta tai paikallista CosyVoice2-asennusta - kaikki toimii infrastruktuurissamme.
-
2
Valitse CosyVoice2 ja lisää viitelippis
Valitse moottoriksesi CosyVoice2 ja lataa sen jälkeen puhtaat 3-10 sekunnin referenssitallenteet äänistä, joita haluat kloonata. CosyVoice2 poimii kaiuttimen ominaisuudet nollalaukauksen monikieliseen kloonaukseen.
-
3
Syötä teksti millä tahansa tuetulla kielellä
Kirjoita tai liitä käsikirjoitus kiinaksi, englanniksi, japaniksi, koreaksi tai kantoniksi. CosyVoice2 tukee ylikielistä synteesiä, joten kloonattu ääni voi puhua eri kieltä kuin viiteliitteessä.
-
4
Luo puhe
Klikkaa generaatiksi ja CosyVoice2 syntetisoi luonnollisen, monikielisen puheen kloonoidulla äänellä, yleensä sekunneissa lyhyessä tekstissä. Huipputason käyttö maksaa 25 opintopistettä tuhatta merkkiä kohti.
-
5
Lataa tai käytä API-rajapintaa
Lataa valmis ääni MP3:na tai WAV:na historiastasi tai automatisoi CosyVoice2-äänen kloonaus mittakaavassa TextToSpeechAI REST API:n kautta.
CosyVoice2 API
Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 tarjoaa luonnollista monikielistä puhetta, jossa äänen kloonauskyky on nolla.",
"voice": "en_US-lessac-medium"
}'
Usein kysyttyjä kysymyksiä
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25