Apie VITS
VITS (Varijų išvada su priešpriešiniu mokymusi iš galo į eilę teksto į eilę) yra greitas, visiškai nervinis TTS modelis, kuris sukuria natūralų garsą. Jis sujungia skirtingus auto-enkoderius su antiversariniu mokymu efektyviai sintezei. VITS puikiai tinka partijų apdorojimui ir programoms, reikalaujančioms tiek kokybės, tiek greičio.
Pagrindinės savybės
Greita sintezė
Visai architektūra greito kalbėjimo kartai.
Partijos perdirbimas
Veiksmingai vienu metu apdorojame kelis tekstus.
Natūralus kalbėjimas
VAE+GAN mokymas gamina natūralią prozodiją ir ritmą.
Daugiakalbis
Vienas modelis palaiko daug garsiakalbių.
Veiksminga
Žemas atminties pėdsakas su geromis charakteristikomis.
Atverti šaltinį
MIT licencijuotas bet kokiam naudojimo atvejui.
Naudoti atvejus
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENKaip vartoti VITS
-
1
Užsiregistruoti nemokamai arba išbandyti demo
Sukurti nemokamą TextToSpeechAI paskyrą, kad gautumėte starterio kreditus, arba naudoti on-lapyje demo išgirsti VITS prieš užsiregistravimą.
-
2
Pasirinkite VITS balso arba garsiakalbio
Naršykite balso biblioteką ir pasirinkite balsą, pažymėtą VITS ženklu. Daugiakalbio VITS biblioteka, įskaitant VCTK garsiakalbio rinkinį, leidžia pasirinkti iš daugelio skirtingų balsų.
-
3
Įveskite savo tekstą
Įveskite arba įklijuokite tekstą, kurį norite kalbėti redaktoriuje. VITS tvarko ilgas praėjimas gerai ir yra idealus partijos ir didelio tūrio turinio.
-
4
Generuoti garsą
Spustelėkite generuoti sintezuoti kalbą su VITS. Kadangi VITS yra labai greitai ir standartas lygis (10 kreditai 1000 simbolių), rezultatai greitai grįžti pigiai.
-
5
Atsisiųsti arba naudoti API
Atsisiųskite baigtą garsą kaip MP3, WAV, arba OGG, arba skambinkite tą patį VITS balso per TextToSpeechAI REST API Automate generuoti savo prašymą.
VITS API
Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS teikia greitą, natūralų kalbą dideliam kiekiui.",
"voice": "vits-ljspeech"
}'
Dažnai užduodami klausimai
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10