CosyVoice2color
PremiumZero-shot vícejazyčné klonování hlasu s podporou streamování
O aplikaci CosyVoice2color
CosyVoice2 je model syntézy řeči nové generace od FunAudioLLM (Alibaba). Dodává přirozený-znějící nulovací hlas klonování napříč několika jazyky streaming schopnost pro nízkonákladové aplikace. Postavený na konečný skalární kvantizační přístup, dosahuje vynikající hlasové podobnosti s jen pár sekund referenčního zvuku.
Klíčové funkce
Zero-shot hlasové klonování
Klonujte jakýkoliv hlas z 3-10 sekund referenčního zvuku s vysokou věrností.
Vícejazyčné
Podporuje čínskou, anglickou, japonskou, korejskou a kantonskou syntézu.
Podpora streamování
Režim nízkonákladového streamingu pro aplikace v reálném čase a interaktivní systémy.
Přírodní prosoda
Pokročilé modelování prosody vytváří přirozenou řeč s vhodnou intonací.
Pouzdra na použití
Jak se používá CosyVoice2color
-
1
Zaregistrujte se a nárokujte zdarma kredity
Vytvořte si zdarma TextToSpeechAI účet pro nárok na startovací kredity, nebo nejprve zkuste demo. Není nutná žádná GPU nebo lokální CosyVoice2 instalace - vše běží na naší infrastruktuře.
-
2
Vyberte CosyVoice2 a přidejte referenční klip
Vyberte CosyVoice2 jako váš motor, pak nahrajte čistý 3-10 druhý referenční záznam hlasu, který chcete klonovat. CosyVoice2 bude extrahovat vlastnosti reproduktoru pro nula-shot vícejazyčné klonování.
-
3
Zadejte svůj text v jakémkoliv podporovaném jazyce
Zadejte nebo vložte svůj skript do čínštiny, angličtiny, japonštiny, korejštiny nebo kantonštiny. CosyVoice2 podporuje mezijazyčnou syntézu, takže klonovaný hlas může mluvit jazykem odlišným od referenčního klipu.
-
4
Generovat řeč
Klikněte na tlačítko generovat a CosyVoice2 syntetizuje přírodní, vícejazyčný projev v klonovaném hlase, obvykle během několika sekund pro krátký text. Premium-tier využití stojí 25 kreditů na 1000 znaků.
-
5
Stáhnout nebo použít API
Stáhněte si hotový zvuk jako MP3 nebo WAV z vaší historie, nebo automatizovat CosyVoice2 hlas klonování v měřítku přes TextToSpeechAI REST API.
CosyVoice2color API
Generovat řeč programově pomocí TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 poskytuje přirozený vícejazyčný projev s možností klonování hlasu s nulovým výstřelem.",
"voice": "en_US-lessac-medium"
}'
Často kladené otázky
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25