Um VITS
-efficient, and highly-efficient neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
Lykilatriði
Hröð samsetning
End-til-enda arkitektúr fyrir hratt tal kynslóð.
Hópvinnsla
Skilvirkt vinna marga texta samtímis.
Náttúruleg tala
VAE + GAN þjálfun framleiðir náttúrulega prosody og takt.
Fjölhátalarar
Einn líkan styður margar hátalara raddir.
Skilvirkt
Lágt minni fótspor með góðum árangri.
Opinn kóði
MIT leyfi fyrir hvaða notkun sem er.
Nota tilfelli
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENHvernig á að nota VITS
-
1
Skráðu þig ókeypis eða prófaðu kynninguna
Búðu til ókeypis TextToSpeechAI reikning til að fá byrjunarpunkta, eða notaðu á síðunni kynningu til að heyra VITS áður en þú skráir þig.
-
2
Veldu VITS rödd eða hátalara
Flettu í raddsafnið og veldu rödd sem er merkt með VITS merkinu.VITS multi-hátalara safnið, þar á meðal VCTK hátalarasett, gerir þér kleift að velja úr mörgum mismunandi röddum.
-
3
Sláðu inn textann þinn
Sláðu inn eða límdu textann sem þú vilt tala í ritilinn. VITS meðhöndlar langar kafla vel og er tilvalið fyrir lotu og mikið magn efni.
-
4
Búa til hljóð
Vegna þess að VITS er mjög hratt og Standard-stig (10 einingar á 1000 stafi), niðurstöður koma aftur fljótt á litlum tilkostnaði.
-
5
Hlaða niður eða nota API
Hlaða niður fullunnum hljóð sem MP3, WAV eða OGG, eða hringdu í sömu VITS rödd í gegnum TextToSpeechAI REST API til að sjálfvirka kynslóð í eigin umsókn.
VITS API
Búa til ræðu forritunarlega með TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS skilar hratt, eðlilegt tal fyrir mikið magn forrit.",
"voice": "vits-ljspeech"
}'
Algengar spurningar
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10