WITY
StandardSzybkie TTS końcowe do końca z naturalnym mową
O tematie WITY
VITS (Wariacyjne wyrażenie z uczeniem się wraz z uczeniem się wraz z końcem do końca Tekst-na-Speak) jest szybkim, końcowym modelem TTS neurologicznym, który generuje naturalnie dźwiękowe wypowiedzi. Połącza variacyjne autokodujące z szkoleniem sprzecznym do skutecznej syntezy. VITS jest doskonały do przetwarzania partii i aplikacji wymagających zarówno jakości, jak i prędkości.
Kluczowe cechy
Szybkie sytematyzacje
Architektura końcowa dla szybkiego wytwarzania mowy.
Przetwarzanie serii
Skutecznie przetwarzanie wielu tekstów jednocześnie.
Przyrodniczy wymówienie
VAE+GAN trening wytwarza naturalną prozję i rytm.
Wielogłośnik
Pojedynczy model obsługuje wiele głośników.
Skuteczność
Mały odcisk pamięci z dobrym wydarzeniem.
Otwarte źródło
MIT licencja do każdego przypadku użytkowania.
Przypadki użytkowania
WITY Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENJak stosować lek WITY
-
1
Zarejestruj się za darmo lub spróbuj demo
Stwórz bezpłatne konto TextToSpeechAI aby uzyskać kredyty starterowe, lub użyj demo na stronie, aby usłyszeć VITS przed zalogowaniem.
-
2
Wybierz głos VITS lub głośnik
Przeglądaj bibliotekę głosową i wybierz głos oznaczony odznaką VITS. Wielokrześniowa biblioteka VITS, w tym set głośnika VCTK, pozwala wybrać z wielu różnych głosów.
-
3
Wpisz tekst
Wpisz lub wklej tekst, który chcesz wymienić do edytora. VITS dobrze obsługuje długie pasy i jest idealny dla partii i wysokiej ilości zawartości.
-
4
Wygeneruj dźwięk
Kliknij generuj, aby z syntezować mowy z VITS. Ponieważ VITS jest bardzo szybki i standard-tyer (10 kredytów na 1000 znaków), wyniki szybko zwracają się z niskimi kosztami.
-
5
Pobierz lub użyj API
Pobierz zakończony dźwięk jako MP3, WAV lub OGG, lub wywołaj ten sam głos VITS przez TextToSpeechAI REST API, aby automatyzować generację w własnej aplikacji.
WITY API
Generuj mowy w programie, używając TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS dostarcza szybkie, naturalne wypowiedzi dla aplikacji o wysokim liczbie.",
"voice": "vits-ljspeech"
}'
Często zadawane pytania
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10