Om VITS
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) er en hurtig, end-to-end neural TTS model, der genererer naturlig-klingende tale. Det kombinerer variational autoencodere med adversarial træning til effektiv syntese. VITS er fremragende til batch behandling og applikationer, der kræver både kvalitet og hastighed.
Nøglefunktioner
Hurtig syntese
End-to-end arkitektur til hurtig tale generation.
Batchforarbejdning
Processer effektivt flere tekster samtidigt.
Naturlig tale
VAE + GAN træning producerer naturlig prosody og rytme.
Multi- SpeakerComment
Enkelt model understøtter flere højttaler stemmer.
Effektiv
Lav hukommelse fodaftryk med god ydeevne.
Åbn kilde
MIT licenseret til enhver use case.
Brugstilfælde
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENHvordan man bruger VITS
-
1
Tilmeld dig gratis eller prøv demoen
Opret en gratis TextToSpeechAI konto for at få startkreditter, eller brug sidedemoen til at høre VITS, før du tilmelder dig.
-
2
Vælg en VITS-stemme eller højttaler
Gennemse stemmebiblioteket og vælg en stemme markeret med VITS-skiltet. Multi-højttaler VITS-biblioteket, herunder VCTK-højttalersættet, lader dig vælge fra mange forskellige stemmer.
-
3
Indtast din tekst
Indtast eller indsæt den tekst, du ønsker talt ind i editoren. VITS håndterer lange passager godt og er ideel til batch og højt volumen indhold.
-
4
Generér lyden
Klik på generere for at syntetisere tale med VITS. Fordi VITS er meget hurtig og Standard-tier (10 kreditter pr 1000 tegn), resultater vender hurtigt tilbage til lave omkostninger.
-
5
Download eller brug API'en
Download den færdige lyd som MP3, WAV, eller OGG, eller ring til den samme VITS stemme gennem TextToSpeechAI REST API til at automatisere generation i din egen ansøgning.
VITS API
Generer tale programmatisk ved hjælp af TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS leverer hurtig, naturlig tale til høj volumen applikationer.",
"voice": "vits-ljspeech"
}'
Ofte stillede spørgsmål
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10