Tietoja VITS
VITS (Variaatiovaikutus advertoriaalioppimiseen loppupään Text-to-Speech) on nopea, loppuun asti ulottuva neuraalinen TTS-malli, joka tuottaa luonnolta kuulostavaa puhetta. Siinä yhdistyvät variaatio-automaattien koodaajat ja advertoriaalinen koulutus tehokkaaseen synteesiin. VITS on erinomainen sekä laatua että nopeutta vaativiin erien käsittelyyn ja sovelluksiin.
Tärkeimmät ominaisuudet
Nopea yhteenveto
Päätteellinen arkkitehtuuri nopeaa puhesukupolvea varten.
Erän käsittely
Käsittele useita tekstejä tehokkaasti yhtä aikaa.
Luonnollinen puhe
VAE+GAN-koulutus tuottaa luontaista prosodiaa ja rytmiä.
Monikielisyys
Yksi malli tukee useita kaiuttimen ääniä.
Tehokas
Hyvällä suorituskyvyllä varustettu matala muistijalanjälki.
Avaa lähdekoodi
MIT:n lupa mihin tahansa käyttötapaukseen.
Käytä tapauksia
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENMiten sitä käytetään VITS
-
1
Rekisteröidy ilmaiseksi tai kokeile demoa
Luo ilmainen TextToSpeechAI-tili, jotta saat aloituskomennot, tai käytä sivulla olevaa demoa VITS:n kuulemiseen ennen ilmoittautumista.
-
2
Valitse VITS-ääni tai -kaiutin
Selaa äänikirjastoa ja valitse VITS-tunnuksella merkitty ääni. Monikielisen VITS-kirjaston, mukaan lukien VCTK-kaiutinsarja, avulla voit valita monista eri äänistä.
-
3
Syötä teksti
Kirjoita tai liitä muokkaimeen teksti, jonka haluat puhutella. VITS käsittelee pitkiä kappaleita hyvin ja sopii erinomaisesti erän ja suuren määrän sisältöön.
-
4
Luo ääni
Klikkaa tuottaa syntetisoida puhe VITS. Koska VITS on erittäin nopea ja Standard-tier (10 krediittiä tuhatta merkkiä kohti), tulokset palaavat nopeasti edullisesti.
-
5
Lataa tai käytä API-rajapintaa
Lataa valmis ääni MP3:na, WAV:na tai OGG:nä tai soita sama VITS-ääni TextToSpeechAI REST API:n kautta automatisoidaksesi sukupolven omassa sovelluksessasi.
VITS API
Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS tarjoaa nopeaa, luonnollista puhetta suurille sovelluksille.",
"voice": "vits-ljspeech"
}'
Usein kysyttyjä kysymyksiä
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10