ВИТС
StandardБыстрое завершение работы TTS с естественной речью
О том, что ВИТС
VITS (Вариационная результативность состязательного обучения для конечных текстовых программ) — это быстрая, отличная модель для неврологических TTS, которая генерирует естественный звук. Она сочетает вариативные автокодеры с состязательным обучением для эффективного синтеза. VITS является отличной для обработки партии и приложений, требующих как качества, так и скорости.
Основные характеристики
Быстрое обобщение
Конец архитектуры для быстрого развития речи.
Обработка партии
Эффективно обрабатывать одновременно несколько текстов.
Естественная речь
Обучение VAE+GAN производит естественный прозодиоз и ритм.
Многоязычный
Единая модель поддерживает голоса нескольких ораторов.
Эффективные
Низкий след памяти с хорошими результатами.
Открытый источник
МТИ лицензировала любой случай использования.
Использовать
ВИТС Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENКак пользоваться ВИТС
-
1
Подпишитесь бесплатно или попробуйте демо
Создайте бесплатный TextToSpeechAI аккаунт, чтобы получить стартер-кредиты, или используйте на сайте демо, чтобы услышать VITS перед подписанием.
-
2
Выбрать голос или громкую речь
Проверьте голосовую библиотеку и выберите голос, помеченные значками VITS. Многоязычная библиотека VITS, включая набор спикера VCTK, позволит выбрать из множества голосов.
-
3
Введите ваш текст
Введите или вставьте текст, на который вы хотите поговорить в редакторе. VITS хорошо работает с длинными отрывками и идеально подходит для пакетного и объемного контента.
-
4
Создать звук
Нажмите на кнопку, чтобы синтезировать речь с VITS. Поскольку VITS очень быстр и стандартный уровень (10 титров на 1000 символов), результаты быстро возвращаются при низкой стоимости.
-
5
Загрузка или использование API
Загрузить заключённый звук как MP3, WAV, или ОВГ, или вызвать тот же голос VITS через TextToSpeechAI REST API, чтобы автоматизировать поколение в вашем собственном приложении.
ВИТС API
Создать речь программно используя TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "ВИТС обеспечивает быстрое, естественное выступление для многочисленных прикладных программ.",
"voice": "vits-ljspeech"
}'
Часто задаваемые вопросы
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10