ВИТС
StandardХөнгөн, төгсгөлөөс төгсгөл хүртэл TTS, байгалийн яриа
Тодорхойлолт ВИТС
-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
Түлхүүр шинж чанарууд
Хурдан синтез
Хурдан яриа үүсгэхийн тулд төгсгөлөөс төгсгөл хүртэлх архитектур.
Бүтээгдэхүүний нэр
Олон текстийг нэг дор үр дүнтэй боловсруулна.
Нийгмийн яриа
VAE+GAN сургалт нь байгалийн хэмнэл, ритмийг бий болгодог.
Олон дуут
Нэг загвар нь олон дуут дууг дэмждэг.
Үр дүнтэй
Хөнгөн, сайн гүйцэтгэлтэй санах ойны хэрэглээ.
Нээлттэй эх
MIT лиценз бүхий бүх хэрэглээний нөхцөлд.
Ашиглах тохиолдол
ВИТС Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENХэрхэн ашиглах вэ ВИТС
-
1
Үнэгүй бүртгүүлэх эсвэл туршилт хийх
TextToSpeechAI-ийн үнэгүй дансыг үүсгэж эхлэх зээл авах эсвэл бүртгүүлэхээс өмнө VITS-ийг сонсох зорилгоор хуудасны демог ашиглана уу.
-
2
VITS дуу хоолой эсвэл дуут дамжуулагчийг сонгоно уу
Хөгжим сонгох
-
3
Таны бичлэгийг оруулна уу
Хэлэх гэсэн үгээ редакторт бичнэ үү эсвэл хавсаргана уу. VITS нь урт хэсгүүдийг сайн хянадаг ба багц болон их хэмжээний агуулгад тохиромжтой.
-
4
Дэлгэцийг үүсгэх
VITS- ээр яриаг синтезлэхийн тулд үүсгэх товчийг дарна уу. VITS маш хурдан, стандарт түвшинтэй (1000 тэмдэгт тутамд 10 кредит) тул үр дүнг бага зардлаар хурдан гаргаж өгнө.
-
5
API татаж авах эсвэл ашиглах
MP3, WAV, OGG хэлбэрээр дууны файлыг татаж авах эсвэл TextToSpeechAI REST API- ээр VITS дууг дуудах замаар өөрийн програмд автоматаар үүсгэх.
ВИТС API
TextToSpeechAI REST API-г ашиглан програмчлалын хэлийг үүсгэх.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS нь өндөр хэмжээтэй програмуудад хурдан, байгалийн яриаг хүргэдэг.",
"voice": "vits-ljspeech"
}'
Заримдаа асуудаг асуултууд
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10