CosyVoice2

Premium

Sauti ya Zeno-shot inayovuma kwa nguvu na kuungwa mkono

Fast Mwendo
Very Good Ubora
Ndiyo Kuunganisha
5 Lugha

Habari CosyVoice2

KosyVoice2 ni mfano wa usemi wa kizazi kipya wa synthesis kutoka FunAudioLM (Alibaba). Inatoa sauti ya asili inayovuka lugha mbalimbali na uwezo wa kupitisha maombi ya chini ya upigaji kura. Imejengwa kwa kutumia mbinu ya kuainisha sauti, inatimiza sauti bora sana kwa sekunde chache tu za milinganisho.

Sehemu Kuu

Sauti ya Zero-shot Yasambaa

Anzisha sauti yoyote kutoka sekunde 3 hadi 10 za rejezeo pamoja na uaminifu wa juu.

Watu Wanaowasiliana Lugha Mbalimbali

Inaunga mkono Kichina, Kiingereza, Kijapani, Kikorea, na Kikantoni kwa kutumia lugha za kienyeji.

Utegemezo Wenye Kuchochea

Njia za kupunguza gharama za maombi na mifumo inayounganisha mawasiliano.

Muundo wa Asili

Uigaji wa kisasa wa kimitindo hutokeza usemi wa kiasili wenye maneno ya kupendeza kwa kutumia lugha ifaayo.

Tumia Visa

Uumbaji wa mbali wa vitu vyenye maana Wasaidizi wa sauti halisi Ukataji - Miti wa Kiserikali Simu za kibinafsi

Jinsi ya Kutumia CosyVoice2

  1. 1

    Tia sahihi na udai sifa bila malipo

    Akaunti huru TextToSpeechAI za madai yako ya mwanzoni, au ujaribu demo kwanza.

  2. 2

    Chagua CosyVoice2 na uongeze kipande cha marejeo

    Chagua orodha ya CosyVoice2 kama injini yako, kisha upakiaji wa mara ya pili kwa vipimo 3-10 kuhusu sauti unayotaka kujigawanya. CosyVoice2 atamwdulia msemaji sifa za uingizaji wa lugha kwa kiwango cha sufuri.

  3. 3

    Na ingia katika Kitabu chenu chenye nuru.

    Aina au nta ya maandishi yako katika Kichina, Kiingereza, Kijapani, Kikorea, au Kikantoni. CosyVoice2 huunga mkono sylingal synthesis, kwa hiyo sauti iliyotokezwa inaweza kuongea lugha tofauti na kisehemu cha marejezo.

  4. 4

    Andaa usemi

    Bonyeza hutokeza na CosyVoice2 hutokeza hotuba ya asili, ya lugha nyingi katika sauti iliyotokezwa, kwa kawaida kwa sekunde chache kwa matumizi mafupi. Matumizi ya Premium-tier hugharimu fedha 25 kwa kila herufi 1,000.

  5. 5

    Pakia au utumie API

    Pakua sauti iliyomalizika baada ya mkusanyiko wa wabunge3 au WAV kutoka historia yako, au sauti ya kimamlaka CosyVoice2 ikifanyizwa kwa usawa kupitia ile sauti ya TextToSpeechAI REST API.

CosyVoice2 API

Hotuba ya Genetea ikitumia mfumo wa reli wa TextToSpeechAI API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 anasambaza hotuba za asili za lugha za lugha zenye uwezo wa kutokeza sauti kwa kutumia sufuri.",
    "voice": "en_US-lessac-medium"
  }'

Maswali Ambayo Watu Huuliza Mara Nyingi

CosyVoice2 ni mfano wa maandishi ya awali na sauti inayotokana na muziki wa FunAudioLM (Alibaice2). Inaunga mkono sauti inayotokana na sauti ya sufuri kutoka kwa sauti ya rejezeo chache tu na inaweza kubadili usemi wa asili katika Kichina, Kiingereza, Kijapani, Kikorea, na Cantonese. On TextToSpeechAI unaweza kuda CosyVoic2 katika kiji cha quark bila ya eneo lolote la ndani.

Naam, CosyVoice2 ni leseni kamili ya Waapache 2.0 - sheria na vilevile mizani za kigezo. Hii hufanya iwe salama kutumia bidhaa za kibiashara, maudhui ya kulipwa, na wateja kufanya kazi bila ada za leseni au vikwazo visivyo vya kibiashara.

CosyVoice2 hutegemeza lugha tano: Kichina (Manaririn), Kiingereza, Kijapani, Kikorea, na Cantonese. Pia inashika sauti ya syling-nallythesis, ili uweze kutokeza sauti kutoka kwa mfumo wa sauti katika lugha moja na kutokeza hotuba katika lugha nyingine.

Safe sekunde 3-10 za sauti safi ya msemaji mlengwa. CosyVoice2 anamwtoa msemaji sifa kwa kutumia njia ya kupima kwa usahihi, kisha anatokeza hotuba mpya katika sauti hiyo inayotokana na lugha yoyote iliyotegemezwa.

CosyVoice2 ni moja ya miundo mikubwa ya utokezwaji wa lugha mbalimbali, inayohifadhi utambulisho wa msemaji hata wakati usemi unaotokeza lugha tofauti na kisehemu cha marejezo. Hutokeza asili ya usukaji na uundaji, jambo ambalo huifanya ifae sana katika kutengeneza sauti za mchanganyiko na maudhui ya kienyeji.

CosyVoice2 ni mfano wa kasi na hutia ndani mtindo wa kumimina sauti unaotoa sauti ya chini, ikifanya ifae wasaidizi wa sauti na maombi ya kupishana. Kwa kawaida, vizazi zaidi ya TextToSpeechAI hukamilisha kwa sekunde chache kwa ajili ya maandishi mafupi.

CosyVoice2 inataka takriban 4-6GB ya VRAM kwa ajili ya muundo wa parameta 0.5B, kwa hiyo GPU yenye 6GB au zaidi inapendekezwa wakati mtu anapojichoma mwenyewe. Mnamo TextToSpeechAI kigezo hicho huendeshwa kwenye miundo ya GPU, kwa hiyo huhitaji vifaa vyovyote vya mwili wako mwenyewe.

CosyVoice2 ni mfano bora na hugharimu fedha 25 kwa kila herufi 1,000 za maandishi. Kila akaunti mpya hupata sifa bila malipo, kwa hiyo unaweza kujaribu sauti ya CosyVoice2 kabla ya kuamua mpango wa kulipwa.

Mara nyingi, injini za kutokeza sauti bora zaidi hukomaa na kutokeza sauti inayofanana sana na ile ya shabaha, huku CosyVoice2 ikihitaji sauti isiyo ya asili ya lugha na inayotumia lugha moja na kuongeza muundo wa sauti ya chini.

Vyombo vyote viwili vinatoa sauti ya juu sana yenye upana wa sufuri-sshot inayotokana na ufanyizaji wa sauti. CosyVoice2 hutegemeza lugha zaidi (takriban tatu) na kuongeza mtiririko wa matumizi halisi, wakati F5-TTS inaweza kuwa na kasi kidogo kwa ajili ya mafuma ya Kiingereza-pea pekee. Kwa miradi ya lugha za CosyVoice2 kwa kawaida ndiyo yenye kufaa zaidi.

Watu TextToSpeechAI wanakuruhusu upeleke nje vizazi vya CosyVoice2 kwa njia za kawaida kama vile MP3 na WAV. Unaweza kupakua faili hiyo moja kwa moja kutoka kwenye ukurasa wako wa historia au kuileta kupitia TextToSpeechAI API.

Unaweza kumpima CosyVoice2 kwa kutumia maandishi huru ya demo na kadi zako za bure za kutoa mikopo kwa watu TextToSpeechAI bila kuweka chochote.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try CosyVoice2 Now

Generate your first audio free. No credit card required.

Start Free