Hangulatos hangok2
PremiumNulla löketű többnyelvű hang klónozás streaming támogatással
About Hangulatos hangok2
A CosyVoice2 a FuNAudioLLM (Alibaba) következő generációs beszédszintézis-modellje. A hangzást okozó, zéró hangú klónozás több nyelven is elérhető, alacsony latenciajú alkalmazásokhoz alkalmas streaming képességgel. Véges skalár kvantálási megközelítésre építve kiváló hanghasonlóságot ér el néhány másodpercnyi referencia audióval.
Kulcsfontosságú jellemzők
Zéró hang klónozása
Klón bármilyen hang 3-10 másodperc referencia hang magas hűség.
Többnyelvű
A kínai, angol, japán, koreai és kantoni nyelvtudást támogatja.
A támogatás közvetítése
Alacsony latency streaming mód valós idejű alkalmazásokhoz és interaktív rendszerekhez.
Természetes prozody
A fejlett proszódia modellezés természetes hangzású beszédet eredményez megfelelő intonációval.
Esetek használata
Hogyan kell alkalmazni? Hangulatos hangok2
-
1
Jelentkezzen és követeljen ingyenes krediteket
Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy megkapja az indító krediteket, vagy próbálja ki a demót először. Nincs szükség GPU-ra vagy helyi CosyVoice2 telepítésre - minden az infrastruktúránkon fut.
-
2
Válassza ki a CosyVoice2 gombot és adjon hozzá egy referencia-klipet
Válassza ki a CosyVoice2 motort, majd töltse fel a tiszta 3-10 másodperces referencia felvételt a hang akar klónozni. CosyVoice2 kivonja a hangszóró jellemzőit nulla-shot többnyelvű klónozás.
-
3
Írja be a szöveget bármely támogatott nyelven
Írja be vagy illessze be a szkriptet kínai, angol, japán, koreai vagy kantoni nyelven. A CosyVoice2 támogatja a többnyelvű szintézist, így a klónozott hang más nyelvet beszélhet, mint a referencia klip.
-
4
A beszéd generálása
Kattintson a generálás és a CosyVoice2 szintetizálja a természetes, többnyelvű beszéd a klónozott hang, általában másodperceken belül a rövid szöveg. Premium-tier használat költsége 25 kredit 1000 karakterenként.
-
5
Az API letöltése vagy használata
Töltse le a kész audiót MP3 vagy WAV-ként a történelemből, vagy automatizálja a CosyVoice2 hang klónozást a TextToSpeechAI REST API-n keresztül.
Hangulatos hangok2 API
A beszéd programszerű generálása a TextToSpeechAI REST API használatával.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "A CosyVoice2 természetes többnyelvű beszédeket biztosít, zéró hang klónozási képességgel.",
"voice": "en_US-lessac-medium"
}'
Gyakran ismételt kérdések
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25