CosyVoice2

Premium

Klonovanie hlasu vo viacerých jazykoch s podporou streamovania

Fast Rýchlosť
Very Good Kvalita
Áno Klonovanie
5 Jazyky

O nás CosyVoice2

[Translation temporarily unavailable. Please try again.]

Kľúčové vlastnosti produktu

Klonovanie hlasu Zero-Shot

Klonovať akýkoľvek hlas z 3-10 sekúnd referenčného zvuku s vysokou vernosťou.

Viacjazyčné

Podporuje čínštinu, angličtinu, japončinu, kórejčinu a kantončinu s medzijazyčnou syntézou.

Podpora pre streaming

Režim streamovania s nízkou latenciou pre aplikácie v reálnom čase a interaktívne systémy.

Prírodné prosody

Pokročilé modelovanie prozódie vytvára prirodzene znejúcu reč s vhodnou intonáciou.

Prípady použitia

Tvorba viacjazyčného obsahu Hlasové asistentky v reálnom čase Cross-language dubbing (dabing) Personalizované hlasové aplikácie

Ako používať CosyVoice2

  1. 1

    Zaregistrujte sa a získajte kredity zdarma

    Vytvorte si bezplatný TextToSpeechAI účet a získajte kredity, alebo si najprv vyskúšajte demo verziu.Nie je potrebná žiadna inštalácia GPU alebo lokálna inštalácia CosyVoice2 - všetko beží na našej infraštruktúre.

  2. 2

    Vyberte CosyVoice2 a pridajte referenčný klip

    Vyberte si CosyVoice2 ako svoj engine, potom nahrajte čistú 3-10 sekundovú referenčnú nahrávku hlasu, ktorý chcete klonovať.CosyVoice2 extrahuje charakteristiky hovoriaceho pre nulový zásah viacjazyčného klonovania.

  3. 3

    Zadajte text v ľubovoľnom podporovanom jazyku

    Zadajte alebo prilepte svoj skript v čínštine, angličtine, japončine, kórejčine alebo kantončine.CosyVoice2 podporuje cross-jazykové syntézy, takže klonovaný hlas môže hovoriť jazykom iným ako referenčný klip.

  4. 4

    Generovať reč

    Kliknite na generovať a CosyVoice2 syntetizuje prirodzenú, viacjazyčnú reč v klonovanom hlase, zvyčajne v priebehu niekoľkých sekúnd pre krátky text.Premium-tier použitie stojí 25 kreditov za 1000 znakov.

  5. 5

    Stiahnite si alebo použite API

    Stiahnite si hotový zvuk ako MP3 alebo WAV z histórie, alebo automatizovať CosyVoice2 klonovanie hlasu v mierke cez TextToSpeechAI REST API.

CosyVoice2 API

Generujte reč programovo pomocou rozhrania REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 prináša prirodzenú viacjazyčnú reč s nulovou schopnosťou klonovania hlasu.",
    "voice": "en_US-lessac-medium"
  }'

Často kladené otázky

CosyVoice2 je ďalšia generácia text-to-speech a klonovanie hlasu model od FunAudioLLM (Alibaba).Podporuje zero-shot klonovanie hlasu z len pár sekúnd referenčného zvuku a môže syntetizovať prirodzený prejav v čínštine, angličtine, japončine, kórejčine a kantončine.Na TextToSpeechAI môžete spustiť CosyVoice2 v prehliadači bez akéhokoľvek lokálneho nastavenia.

Áno, CosyVoice2 je plne licencovaný Apache 2.0 - kód aj modelové váhy, čo ho robí bezpečným pre použitie v komerčných produktoch, platenom obsahu a klientskej práci bez licenčných poplatkov alebo nekomerčných obmedzení.

CosyVoice2 podporuje päť jazykov: čínštinu (mandarínčinu), angličtinu, japončinu, kórejčinu a kantončinu, a tiež zvláda syntézu medzi jazykmi, takže môžete klonovať hlas z nahrávky v jednom jazyku a generovať reč v inom.

Poskytnite 3-10 sekúnd čistého referenčného zvuku cieľového rečníka. CosyVoice2 extrahuje charakteristiky rečníka pomocou konečného skalárneho kvantizačného prístupu a potom generuje novú reč v klonovanom hlase v ktoromkoľvek z podporovaných jazykov.Nevyžaduje sa žiadne trénovanie modelu ani jemné ladenie.

CosyVoice2 je jedným zo silnejších viacjazyčných klonovacích modelov, ktorý zachováva identitu hovoriaceho aj pri generovaní reči v inom jazyku ako referenčný klip.Vytvára prirodzenú prozódiu a intonáciu, čo ho robí vhodným pre viacjazyčné dabing a lokalizovaný obsah.

CosyVoice2 je rýchly model a obsahuje režim streamovania, ktorý produkuje zvuk s nízkou latenciou, vďaka čomu je vhodný pre hlasových asistentov a interaktívne aplikácie. Na TextToSpeechAI generácií sa zvyčajne dokončí v priebehu niekoľkých sekúnd pre krátke texty.

CosyVoice2 vyžaduje približne 4-6GB VRAM pre model s parametrami 0.5B, takže pri self-hosting je odporúčaný GPU so 6GB alebo viac.Na TextToSpeechAI model beží na našej GPU infraštruktúre, takže nepotrebujete žiadny vlastný hardvér.

CosyVoice2 je prémiový model, ktorý stojí 25 kreditov za 1000 znakov textu. Každý nový účet dostane bezplatné kredity, takže si môžete vyskúšať CosyVoice2 klonovanie hlasu predtým, než sa rozhodnete pre platený plán.

Obidva sú špičkové nástroje na klonovanie hlasu. GPT-SoVITS často dosahuje najvyššiu hrubú podobnosť pre jeden cieľový hlas, zatiaľ čo CosyVoice2 je silnejší pre viacjazyčné a medzijazykové klonovanie a pridáva režim streamovania s nízkou latenciou. Vyberte CosyVoice2, ak potrebujete jeden klonovaný hlas hovoriť viacerými jazykmi.

Obidve ponúkajú vysokokvalitné klonovanie hlasu bez nuly. CosyVoice2 podporuje viac jazykov (5 oproti 2) a pridáva streamovanie na použitie v reálnom čase, zatiaľ čo F5-TTS môže byť o niečo rýchlejší pre pracovné zaťaženie len v angličtine.

TextToSpeechAI umožňuje export generácií CosyVoice2 v bežných formátoch ako MP3 a WAV, súbor si môžete stiahnuť priamo z histórie alebo ho načítať programovo cez TextToSpeechAI API.

Áno, CosyVoice2 môžete vyskúšať s bezplatnou demo verziou a bezplatnými kreditmi na TextToSpeechAI bez inštalácie. Stačí sa zaregistrovať, nahrať krátky referenčný klip, napísať text v ľubovoľnom podporovanom jazyku a generovať.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try CosyVoice2 Now

Generate your first audio free. No credit card required.

Start Free