Om VIT
VITS (Variativ inferens med antagonistisk læring for ende- til- ende tekst- til- tale) er en rask, ende- til- ende nevral TTS- modell som lager naturlig lydertalende tale. Den kombinerer variasjons- autoencodere med antagonistisk trening for effektiv syntese. VITS er fremragende for satsvis behandling og programmer som krever både kvalitet og hastighet.
Nøkkelfunksjoner
Rask syntese
Ende-til-ende-arkitektur for rask talegenerering.
Partibehandling
Bearbeide flere tekster på en effektiv måte samtidig.
Naturlig tale
VAE+GAN-opplæringen gir naturlig prosodi og rytme.
Flertaler
En enkel modell støtter flere høyttalerrøyster.
Effektiv
Lavt minneavtrykk med god ytelse.
Åpne kildekode
MIT lisensiert for alle brukstilfeller.
Brukstilfeller
VIT Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENBruksmåte VIT
-
1
Registrer deg gratis eller prøv demoen
Lag en gratis TextToSpeechAI konto for å få startpoeng, eller bruk demoen på siden til å høre VITS før du melder deg.
-
2
Velg en VITS-tale eller høyttaler
Bla gjennom talebiblioteket og velg en stemme merket med VITS- skiltet. Flertaler- VITS- biblioteket, medregnet VCTK- høyttaleren, kan du velge blant mange forskjellige stemmer.
-
3
Skriv inn teksten
Skriv inn eller lim inn teksten du vil ha snakket inn i redigeringen. VITS håndterer lange avsnitt godt og er ideell for satsvis og høyt innhold.
-
4
Lag lyd
Trykk på Lag for å syntesere tale med VITS. Fordi VITS er svært raskt og Standard- nivå (10 kredittvurderinger pr. 1000 tegn), så returneres resultatene raskt til lav kostnad.
-
5
Last ned eller bruk API
Last ned den ferdige lyden som MP3, WAV eller OGG, eller ring opp den samme VITS-stemmen gjennom TextToSpeechAI REST API for å automatisere generering i ditt eget program.
VIT API
Generer taleprogrammatisk ved å bruke TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS leverer en rask, naturlig tale for anvendelser i store serier.",
"voice": "vits-ljspeech"
}'
Ofte stilte spørsmål
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10