Udobni glasnik2
PremiumZmanjšanje večjezične kloniranja glasov z podporo streaminga
O projektu Udobni glasnik2
CosyVoice2 je sintetičen model naslednje generacije govora iz FunaudioLLM (Alibaba). Zagotavlja naravno brezzvočno kloniranje glasa v več jezikih z streaming zmožnostjo za nizko poznejše aplikacije. Zgrajen na končni skalar kvantizacijski pristop, doseže odlično glas podobnost z le nekaj sekundami referenčnega zvoka.
Ključne lastnosti
Kloniranje glasu brez streljanja
Kloniraj glas iz 3-10 sekund referenčnega zvoka z visoko zvestobo.
Večjezična
Podpira kitajsko, angleško, japonsko, korejsko in kantonsko sintezo.
Streaming support
Nizko-lateralni način streaming za aplikacije v realnem času in interaktivne sisteme.
Naravna prozodija
Napredno prozodijska modeliranje ustvarja naravno-zvočni govor z ustrezno intonacijo.
Uporabne primere
Kako uporabljati Udobni glasnik2
-
1
Prijavi se in zahtevaj brezplačne kredite
Ustvarite brezplačno TextToSpeechAI račun, da zahtevate svoje starter kredite, ali poskusite najprej demo. Ni potreben GPU ali lokalni CosyVoice2 install - vse teče na naši infrastrukturi.
-
2
Izberite CosyVoice2 in dodajte referenčni posnetek
Izberite CosyVoice2 kot motor, nato naložite čist 3-10 sekunde referenčne snemanje glasu, ki ga želite klonirati. CosyVoice2 bo izvlekel zvočnike značilnosti za nič-shot večjezično kloniranje.
-
3
Vnesite svoje besedilo v katerem koli podprti jeziku
Vpišite ali prilepite svoj skript v kitajskem, angleškem, japonskem, korejskem ali kantonskem. CosyVoice2 podpira navzkrižno-jezično sintezo, tako da klonirani glas lahko govori jezik, ki je drugačen od referenčnega izrezka.
-
4
Ustvari govor
Kliknite generirati in CosyVoice2 sintetizira naravni, večjezični govor v kloniranem glasu, običajno v nekaj sekundah za kratko besedilo. Premium-tier uporaba stane 25 kreditov na 1.000 znakov.
-
5
Prenesi ali uporabi API
Prenesi končan zvok kot MP3 ali WAV iz zgodovine ali avtomatsko kloniranje glasu CosyVoice2 v skali skozi TextToSpeechAI REST API.
Udobni glasnik2 API
Ustvarite govor programsko z uporabo TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 zagotavlja naravno večjezično govorjenje z nič ustreljeno glasovno sposobnostjo kloniranja.",
"voice": "en_US-lessac-medium"
}'
Pogosta vprašanja
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25