متعلقہ VITS
-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
کلیدی خصوصیات
جلدي سنتز
تیزی سے بولنے کی پیداوار کے لئے آخر تک فن تعمیر.
بٹ پروسیسنگ
متعدد تحریروں کو ایک ساتھ موثر طور پر پروسس کریں
فطری بولي
وی اے ای + گان تربیت قدرتی prosody اور ریتھ پیدا کرتا ہے.
متعدد اسپیکر
ایک ماڈل متعدد اسپیکر آوازوں کو مدد دیتا ہے.
موثر
اچھی کارکردگی کے ساتھ کم میموری فوٹ پرنٹ.
اوپن سورس
MIT کسی بھی استعمال کے معاملے کے لئے لائسنس.
استعمال کے حالات
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENاستعمال کيونکر کريں VITS
-
1
مفت میں رجسٹر کریں یا ڈیمو کو آزمائیں
شروع کریڈٹ حاصل کرنے کے لئے ایک مفت TextToSpeechAI اکاؤنٹ بنائے، یا ان-پیج ڈیمو استعمال کر کے VITS کو سننے کے لئے سائن اپ کرنے سے پہلے.
-
2
VITS آواز يا اسپيکر منتخب کريں
آواز لائبرري براؤز کريں اور VITS با ج سے نشان زد آواز منتخب کريں VCTK اسپيکر سٹ شامل کر کے ملٹی اسپيکر VITS لائبر ري آپ کو مختلف آوازوں سے انتخاب کر نے کي اجازت ديتي هے
-
3
آپ کا متن داخل کریں
ٹائپ يا پيسٹ کريں يه متن آپ ايڈيٽر ميں بولنا چا هيتے هيں VITS طويل گزرے کو اچھي طرح سے ہینڈل کر تا هے اور بيٹ اور بلند حجم کے مواد کے ليے مثالي هے
-
4
آڈیو بناؤ
VITS کے ساتھ بولي سنتھز کر نے کے ليے جنرائز کريں کلک کريں VITS بہت جلدي اور معياري سطح (10 کرڈٹس پر 1000 حروف) هے ، نتيجے کم قيمت پر جلدي واپس آتے هيں
-
5
API ڈائون لوڈ کریں یا استعمال کریں
MP3, WAV, or OGG کے طور پر ختم شدہ اوڈيو ڈائون لوڈ کریں، يا TextToSpeechAI REST API کے ذریعے ویٹس آواز کو بلايں آپ کے آپريشن میں خودکار پیداوار کے ليے
VITS API
TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS تیز، اعلیٰ حجم کے ایپلیکیشنوں کے لئے قدرتی کلام فراہم کرتا ہے.",
"voice": "vits-ljspeech"
}'
بار بار پوچھے گئے سوالات
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10