O aplikaci VITS
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je rychlý, konečný neurální TTS model, který generuje přirozeně znějící řeč. Kombinuje variační autokodéry s adversarial školením pro efektivní syntézu. VITS je vynikající pro dávkové zpracování a aplikace vyžadující jak kvalitu, tak rychlost.
Klíčové funkce
Rychlá syntéza
Architektura ke konci pro rychlou tvorbu řečí.
Zpracování šarže
Efektivně zpracováváme více textů současně.
Přírodní mluva
Výcvik VAE+GAN vytváří přírodní prosody a rytmus.
Víceproudový reproduktor
Jednotlivý model podporuje vícehlasy reproduktorů.
Efektivní
Nízká paměťová stopa s dobrým výkonem.
Otevřít zdroj
MIT licencované pro jakýkoli případ použití.
Pouzdra na použití
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENJak se používá VITS
-
1
Zaregistrujte se zdarma nebo vyzkoušejte demo
Vytvořit zdarma TextToSpeechAI účet pro získání startér kreditů, nebo pomocí on-page demo slyšet VITS před přihlášením.
-
2
Vyberte VITS hlas nebo reproduktor
Prohlédněte si hlasovou knihovnu a vyberte si hlas označený odznakem VITS. Multi-speaker VITS knihovna, včetně VCTK reproduktor set, vám umožní vybrat z mnoha různých hlasů.
-
3
Zadejte svůj text
Zadejte nebo vložte text, který chcete přeložit do editoru. VITS zvládá dlouhé pasáže dobře a je ideální pro dávkové a velkoobjemové obsahy.
-
4
Generovat zvuk
Klikněte na tlačítko generovat syntetizovat řeč s VITS. Vzhledem k tomu, VITS je velmi rychlý a Standard-tier (10 kreditů na 1000 znaků), výsledky se rychle vrátí za nízké náklady.
-
5
Stáhnout nebo použít API
Stáhněte si hotový zvuk jako MP3, WAV, nebo OGG, nebo volejte stejný VITS hlas přes TextToSpeechAI REST API automatizovat generaci ve své vlastní aplikaci.
VITS API
Generovat řeč programově pomocí TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS přináší rychlou, přirozenou řeč pro velkoobjemové aplikace.",
"voice": "vits-ljspeech"
}'
Často kladené otázky
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10