VITS
StandardGyors végkifejletű TTS természetes beszédtel
About VITS
VITS (Variational Inverence with anversarial learning for end-to-end Text-to-Speech) egy gyors, végponttól végpontig terjedő neurális TTS modell, amely természetes hangzású beszédet generál. Ez egyesíti a variációs autoenkoderek és a hatékony szintézist célzó ellenző képzés. VITS kiválóan alkalmas a gyártási folyamatokra és alkalmazásokra, amelyek minőségre és sebességre egyaránt igényelnek.
Kulcsfontosságú jellemzők
Gyorsszintézis
Vége az építészetnek a gyors beszédekért.
Gy. sz.:
A szövegeket hatékonyan egyszerre kell feldolgozni.
Természetes beszéd
A VAE+GAN képzés természetes proszódiát és ritmust eredményez.
Több hangszóró
Egy modell több hangszóró hangját támogatja.
Hatékony
Alacsony memória lábnyom jó teljesítménysel.
Nyílt forrás
MIT engedélyezve bármilyen felhasználási esetre.
Esetek használata
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENHogyan kell alkalmazni? VITS
-
1
Regisztráljon ingyen vagy próbálja ki a demót
Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy kezdő krediteket kapjon, vagy használja a honlapon megjelenő demót a VITS meghallgatására, mielőtt regisztrálna.
-
2
Válasszon VITS hangot vagy hangszórót
Böngésszen a hangkönyvtár és válassza ki a hang jelölt VITS jelvény. A több hangszórós VITS könyvtár, beleértve a VCTK hangszóró készlet, lehetővé teszi, hogy válasszon a sok különböző hangok.
-
3
Írja be a szöveget
Írja be vagy illessze be a kívánt szöveget a szerkesztőbe. VITS kezeli a hosszú szakaszokat jól, és ideális a tétel és nagy mennyiségű tartalom.
-
4
Hang generálása
Kattintson a generáláshoz szintetizálja beszéd VITS. Mivel a VITS nagyon gyors és Standard-tier (10 kredit 1000 karakterenként), eredmények gyorsan visszatérnek alacsony áron.
-
5
Az API letöltése vagy használata
Töltse le a kész audio MP3, WAV, vagy OGG, vagy hívja ugyanazt a VITS hangot keresztül a TextToSpeechAI REST API automatizálja generáció saját alkalmazás.
VITS API
A beszéd programszerű generálása a TextToSpeechAI REST API használatával.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "A VITS gyors, természetes beszédet biztosít a nagy volumenű alkalmazásokhoz.",
"voice": "vits-ljspeech"
}'
Gyakran ismételt kérdések
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10