TTS စတိုင် ၂
Ultraပုံစံပြောင်းခြင်းနှင့်အတူလူသား-အဆင့်စာသား-to-စကားပြော
အကြောင်း TTS စတိုင် ၂
s. StyleTTS 2 is the first TTS system to use the
အဓိကအင်္ဂါရပ်များ
လူသားအဆင့် အရည်အသွေး
မျက်စိမှိတ်စစ်ဆေးမှုတွင် လူသားမှတ်တမ်းတင်မှုမှ ခွဲခြားမပြနိုင်သော စကားပြောကို ထုတ်လုပ်သည်။
ပုံစံ လွှဲပြောင်းခြင်း
အသံနမူနာမှ စကားပြောစတိုင်ကို ကူးယူပါ
သဘာဝ အသုံးအနှုန်း
ပြီးပြည့်စုံသောဂီတ, ဖိအား, diffusion-based modeling နှင့်အတူအသံသွင်း.
အသံဖမ်းယူခြင်း
ထူးခြားတဲ့တိကျမှုနှင့်သဘာဝကျကျအသံများ clone ။
အမြန်ဆုံး ကောက်ချက်ချခြင်း
အရည်အသွေးထိန်းသိမ်းနေစဉ် autoregressive ပုံစံများထက်ပိုမိုမြန်ဆန်။
ရင်းမြစ် ဖွင့်
MIT လိုင်စင်နှင့်အတူအပြည့်အဝစီးပွားရေးအသုံးပြုခွင့်ရှိသည်။
အသုံးပြုမှုအခြေအနေများ
TTS စတိုင် ၂ Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENဘယ်လိုအသုံးပြုရမည် TTS စတိုင် ၂
-
1
အခမဲ့မှတ်ပုံတင်သို့မဟုတ် demo ကို run
Starter Credits ရယူရန် အခမဲ့ TextToSpeechAI Account တစ်ခု ဖန်တီးပါ။ သို့မဟုတ် Homepage Demo ကိုအသုံးပြုပြီး StyleTTS2 ကို နားထောင်ပါ။
-
2
StyleTTS2 အင်ဂျင်ကို ရွေးပါ
အသံစာအုပ်ဆိုင်မှ StyleTTS2 အသံကို ရွေးချယ်ပါ။ အသံကို ကူးယူရန်အတွက် 10-30 စက္ကန့် reference clip ကို upload လုပ်ပါ။ StyleTTS2 က ၎င်း၏ style ကို ကူးယူသွားပါလိမ့်မယ်။
-
3
စာသားကို ထည့်ပါ
StyleTTS2 အင်္ဂလိပ်မှာ excels နှင့်သဘာဝ prosody ပေးပို့, ဖိအား, နှင့်ရှည်လျားသော passages ကျော် intonation.
-
4
အသံဖိုင်ကို ထုတ်လုပ်ပါ
Click generate and TextToSpeechAI renders your StyleTTS2 audio on GPU. Ultra-tier StyleTTS2 costs 50 credits per 1000 characters.
-
5
API ကို download လုပ်ပါ
MP3 အဖြစ်ပြီးစီး StyleTTS2 အသံဖိုင်ကိုဒေါင်းလုပ်, WAV, သို့မဟုတ် OGG, သို့မဟုတ် generation ကို automate ရန်သင်၏ StyleTTS2 အသံနှင့်အတူ TextToSpeechAI API ကိုခေါ်ဆို.
TTS စတိုင် ၂ API
TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS2ဒါကြောင့်သဘာဝစကားပြောထုတ်လုပ်, ဒါဟာပရော်ဖက်ရှင်နယ်လူသားမှတ်တမ်းတင် rivals.",
"voice": "styletts2-default"
}'
မေးလေ့ရှိသောမေးခွန်းများ
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50