За ВИТС
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speak) е бърз, край-то-краен Neural TTS модел, който генерира естествено-звучна реч. Съчетава вариационни автокодери с административно обучение за ефективен синтез. VITS е отлично за преработка на партиди и приложения, изискващи както качество, така и скорост.
Ключови характеристики
Бързо синтезиране
Край-то-край архитектура за построяване на бързи думи.
Пакетна обработка
Ефективно обработване на множество текстове едновременно.
Естествена реч
VAE+GAN обучението произвежда естествена прозодия и ритъм.
Многозвук
Единственият модел поддържа множество гласове.
Ефективно
Нисък отпечатък от паметта с добро изпълнение.
Отворен източник
MIT лицензиран за всеки случай на употреба.
Случаи за използване
ВИТС Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENКак да използвате ВИТС
-
1
Запишете се безплатно или опитайте демото
Създайте безплатен акаунт TextToSpeechAI, за да получите стартер кредити, или да използвате демото на страницата, за да чуете VITS преди да се регистрира.
-
2
Изберете глас или говорител на VITS
Преглед на гласовата библиотека и изберете глас, маркиран с значката VITS. Библиотеката VITS, включително настройката на VCTK, ви позволява да изберете от много различни гласове.
-
3
Въведете вашия текст
Въведете или вметнете текста, който искате да говорите в редактора. VITS се справя добре с дълги пасажи и е идеален за партидно и високо обемно съдържание.
-
4
Създаване на звука
Кликнете, за да синтезирате речта с VITS. Тъй като VITS е много бързо и Standard-tier (10 кредита на 1000 символа), резултатите се връщат бързо с ниска цена.
-
5
Изтеглете или използвайте API
Изтеглете завършения звук като MP3, WAV или OGG, или се обадите на същия VITS глас чрез TextToSpeechAI REST API, за да автоматизирате поколението си в собствената програма.
ВИТС API
Генерирайте речна програма с помощта на TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS осигурява бързо, естествено говорене за високообемни приложения.",
"voice": "vits-ljspeech"
}'
Често задавани въпроси
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10