& Бұл туралы VITS
-efficient, and low-cost TTS model that generates natural-sounding speech. It is a
Басты мүмкіндіктері
Жедел синтез
Архитектуралық стильдер мен стильдік стильдер арасындағы айырмашылықтар.
Дестелік өңдеу
Бірнеше мәтіндерді бір мезгілде тиімді өңдеу.
Табиғи дыбыс
Қазақ тілі мен әдебиеті пәнінің мұғалімі, доцент.
Көп дыбыс шығарғыш
Біріншісі – лингвистикалық модель, екіншісі – лингвистикалық модель.
Тиімді
Жадты аз пайдаланады, бірақ жылдамдығы жақсы.
Ашық коды
MIT лицензиясы кез келген пайдалану жағдайы үшін.
Пайдалану жағдайлары
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENПайдалануы VITS
-
1
Тегін тіркеліңіз немесе демоны сынап көріңіз
TextToSpeechAI-нан астам нұсқасы бар, олардың ішінде TextToSpeechAI-нан астам нұсқасы 1999 жылы шығарылған, ал TextToSpeechAI-нан астам нұсқасы 2000 жылы шығарылған.
-
2
VITS дыбыс не динамигін таңдау
Дыбыс тізімін қарап, VITS белгісі бар дыбысын таңдаңыз. VCTK динамик жиынынан басқа, көп дыбыс шығаратын VITS жиынында көптеген дыбыстарды таңдауға болады.
-
3
Мәтінді келтіріңіз
Мәтінді жазу үшін редакторға жазуды немесе орналастыруды таңдаңыз. VITS ұзақ фрагменттерді жақсы өңдейді, ірі көлемдегі мазмұнды жинақтау үшін өте қолайлы.
-
4
Дыбыс файлын құру
VITS- те сөйлеуді синтездеу үшін Жалпылау дегенді басыңыз. VITS өте жылдам және Стандартты деңгейдегі (1000 таңба үшін 10 кредит) болғандықтан, нәтижелер тез және арзан қайтарылады.
-
5
API жүктеп алу не қолдану
Аудио файлды MP3, WAV, OGG түрінде жүктеп алыңыз, немесе өзіңіздің қолданбаңызда автоматты түрде жасау үшін TextToSpeechAI REST API арқылы VITS дыбысын шақырыңыз.
VITS API
TextToSpeechAI REST API-мен бағдарламалық түрде сөйлеуді құру.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS жылдам, табиғи сөйлеу үшін көп көлемді қолданбаларды ұсынады.",
"voice": "vits-ljspeech"
}'
Жиі қойылатын сұрақтар
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10