Info VITS
VITS (Variational Inference with advariarial learning for end-to-end text-to-Speech) on kiire, otsast lõpuni neuraalne TTS mudel, mis tekitab loomuliku kõlava kõne. See ühendab variational autoencoders võistleva koolituse tõhus süntees. VITS on suurepärane partii töötlemise ja rakendused nõuavad nii kvaliteeti ja kiirust.
Peamised omadused
Kiire kokkuvõte
Lõpp-to-end arhitektuur kõne kiire põlvkonna.
Partii töötlemine
Töötleb mitut teksti üheaegselt tõhusalt.
Loomulik kõne
VAE+GAN koolitus toodab loomulikku prosoodiat ja rütmi.
Multikõlar
Üks mudel toetab mitut kõlari häält.
Tõhus
Madal mälu jalajälg hea jõudlusega.
Avatud lähtekoodiga
MIT litsentseeritud kasutamiseks mis tahes juhul.
Kasutusklassid
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENKuidas kasutada VITS
-
1
Registreeru tasuta või proovi demo
Loo tasuta TextToSpeechAI konto saada starter krediiti, või kasutada on-page demo kuulda VITS enne registreerumist.
-
2
Vali VITS hääl või kõlar
Vajuta hääleraamatukogu ja vali VITS-märgiga hääl. Mitmehäälne VITS-i teek, kaasa arvatud VCTK-i kõlar, võimaldab valida paljudest erinevatest häältest.
-
3
Sisesta oma tekst
Kirjuta või kleebi tekst, mida soovid redaktorisse kirjutada. VITS käsitseb pikki lõike hästi ning sobib ideaalselt partii ja suuremahulise sisu jaoks.
-
4
Audio genereerimine
Kliki genereerida sünteesida kõne VITS. Kuna VITS on väga kiire ja Standard-tier (10 krediiti 1000 tähemärki), tulemused naasevad kiiresti madala hinnaga.
-
5
API allalaadimine või kasutamine
Laadige valmis heli MP3, WAV, või OGG, või helistage sama VITS hääl TextToSpeechAI REST API automatiseerida põlvkonna oma taotluse.
VITS API
Loo kõne programmiliselt kasutades TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS pakub kiiret loomulikku kõnet suuremahulistele rakendustele.",
"voice": "vits-ljspeech"
}'
Korduma kippuvad küsimused
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10