VITS
StandardSnelle End-to-End TTS met natuurlijke spraak
Info VITS
VITS (Variationele Inferentie met tegensprekend leren voor end-to-end Text-to-Speech) is een snel end-to-end neuraal TTS-model dat natuurlijke spraak genereert. Het combineert variatiele autoencoders met tegenstrijdige training voor een efficiënte synthese. VITS is uitstekend voor batchverwerking en toepassingen die zowel kwaliteit als snelheid vereisen.
Belangrijkste kenmerken
Snelle synthese
End-to-end architectuur voor snelle spraakgeneratie.
Verwerking van de partij
Bewerk meerdere teksten tegelijkertijd efficiënt.
Natuurlijke spraak
VAE+GAN training produceert natuurlijke prosody en ritme.
Multi-spreker
Enkel model ondersteunt meerdere luidsprekerstemmen.
Efficiënt
Lage geheugen voetafdruk met goede prestaties.
Bron openen
MIT licentie voor elke use case.
Gebruik kasten
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENHoe gebruikt u dit middel? VITS
-
1
Gratis aanmelden of probeer de demo
Maak een gratis TextToSpeechAI account aan om starter credits te krijgen, of gebruik de demo op de pagina om VITS te horen voordat u zich aanmeldt.
-
2
Kies een VITS-stem of -luidspreker
Blader door de spraakbibliotheek en kies een stem die gemarkeerd is met de VITS-badge. Met de VITS-bibliotheek met meerdere luidsprekers, inclusief de VCTK-luidsprekerset, kunt u kiezen uit verschillende stemmen.
-
3
Voer uw tekst in
Typ of plak de tekst die u wilt spreken in de editor. VITS behandelt lange passages goed en is ideaal voor batch en hoogvolume inhoud.
-
4
Het audio-bestand aanmaken
Klik om spraak te maken met VITS. Omdat VITS zeer snel is en Standard-tier (10 credits per 1000 tekens), zijn de resultaten snel en tegen lage kosten terug te keren.
-
5
Download of gebruik de API
Download de voltooide audio als MP3, WAV, of OGG, of bel dezelfde VITS-stem via de TextToSpeechAI REST API om generatie te automatiseren in uw eigen toepassing.
VITS API
Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS levert snelle, natuurlijke spraak voor toepassingen met een hoog volume.",
"voice": "vits-ljspeech"
}'
Veelgestelde vragen
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10