ရုပ်ပုံ
Standardသဘာဝစကားပြောနှင့်အတူမြန်ဆန် End-to-End TTS
အကြောင်း ရုပ်ပုံ
-efficient, and highly-efficient neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
အဓိကအင်္ဂါရပ်များ
အမြန်ပေါင်းစပ်ခြင်း
မြန်ဆန်သောစကားပြောထုတ်လုပ်မှုအတွက် end-to-end architecture ။
အုပ်စုလိုက်စီမံခြင်း
များစွာသောစာသားများကိုတစ်ပြိုင်နက်တည်းထိရောက်စွာစီမံခန့်ခွဲပါ။
သဘာဝစကားပြော
VAE + GAN လေ့ကျင့်ရေးသဘာဝ prosody နှင့်အလှဆင်ထုတ်လုပ်.
အမျိုးမျိုးသော ထုတ်လွှင့်သူများ
Single model များမှာ speaker voice များ ပါဝင်သည်။
စွမ်းဆောင်ရည်
ကောင်းမွန်သောစွမ်းဆောင်ရည်နှင့်အတူအနည်းငယ်မှတ်ဉာဏ်ခြေရာခံ။
ရင်းမြစ် ဖွင့်
MIT လိုင်စင်ကိုအသုံးပြုခြင်းအတွက်မည်သည့်ကိစ္စအတွက်။
အသုံးပြုမှုအခြေအနေများ
ရုပ်ပုံ Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENဘယ်လိုအသုံးပြုရမည် ရုပ်ပုံ
-
1
အခမဲ့မှတ်ပုံတင်သို့မဟုတ် demo ကိုစမ်းသပ်
Starter Credits များရယူရန် အခမဲ့ TextToSpeechAI Account တစ်ခု ဖန်တီးပါ။ သို့မဟုတ် VITS ကိုကြားရရန် အပေါ်-စာမျက်နှာ Demo ကိုအသုံးပြုပါ။
-
2
VITS အသံ သို့မဟုတ် ထုတ်လွှင့်သူကို ရွေးပါ
Voice Library ကို ရှာဖွေပြီး VITS badge နဲ့ အမှတ်အသားပြုထားတဲ့ အသံကို ရွေးချယ်ပါ။ VCTK speaker set ပါဝင်တဲ့ multi-speaker VITS Library ဟာ ကွဲပြားတဲ့ အသံများစွာထဲက ရွေးချယ်ခွင့်ပြုပါတယ်။
-
3
စာသားကို ထည့်ပါ
Type or paste the text you want to speak into the editor. VITS ကြာ passages ကောင်းစွာကိုင်တွယ်ပြီး batch နှင့် high-volume content အတွက်အလွန်ဖြစ်ပါသည်.
-
4
အသံဖိုင်ကို ထုတ်လုပ်ပါ
VITS နှင့်အတူစကားပြော synthesize ရန် generate ကိုကလစ်နှိပ်ပါ. VITS အလွန်မြန်ဆန်ပြီး Standard-tier ဖြစ်ပါတယ်ကြောင့် (10 credits per 1000 characters), အကျိုးဆက်များနိမ့်ကုန်ကျစရိတ်တွင်လျင်မြန်စွာပြန်လာ.
-
5
API ကို download လုပ်ပါ
MP3, WAV, or OGG အဖြစ်ပြီးစီးအသံကိုဒေါင်းလုပ်လုပ်, သို့မဟုတ်သင်၏ကိုယ်ပိုင် application ကိုထဲမှာ generation ကို automate TextToSpeechAI REST API ကိုမှတဆင့်တူညီ VITS အသံကိုခေါ်ဆို.
ရုပ်ပုံ API
TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS မြန်နှုန်းမြင့်, မြင့်မားသော\u002Dvolume applications များအတွက်သဘာဝစကားပြောပေးပို့။",
"voice": "vits-ljspeech"
}'
မေးလေ့ရှိသောမေးခွန်းများ
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10