GPT-Sovits
Premiumအမြင့်ဆုံးအရည်အသွေး output နဲ့အနည်းငယ်-ရိုက်ချက်အသံကို clone
အကြောင်း GPT-Sovits
-quality speech clones.
အဓိကအင်္ဂါရပ်များ
အသံဖမ်းယူခြင်း
Clone 3-10 စက္ကန့်အရည်အသွေးအကောင်းဆုံးအတွက် transcript တစ်ခုနှင့်အတူအညွှန်း audio ကိုမှမည်သည့်အသံကိုမှ.
Cross-ဘာသာစကားပေါင်းစပ်
တစ်ခုတည်းသောဘာသာစကားအပေါ်လေ့ကျင့်သင်ကြားနှင့်တရုတ်စကားပြော generate, အင်္ဂလိပ်, ဂျပန်, ကိုရီးယား, သို့မဟုတ်ကွန်တိုနီ.
အရည်အသွေး အကောင်းဆုံး
GPT-Sovits စဉ်ဆက်မပြတ်ရရှိနိုင်အမြင့်ဆုံးအရည်အသွေးအသံ clone ပုံစံများအကြား ranks.
ရင်းမြစ် ဖွင့်
လုံးဝ MIT ၏လိုင်စင်တက်ကြွလူ့အဖွဲ့အစည်းဖွံ့ဖြိုးရေးနှင့်ကျယ်ပြန့်စာရွက်စာတမ်းများနှင့်အတူ.
အသုံးပြုမှုအခြေအနေများ
ဘယ်လိုအသုံးပြုရမည် GPT-Sovits
-
1
အခမဲ့အကောင့်တစ်ခုဖန်တီးသို့မဟုတ် demo ကိုဖွင့်
အခမဲ့စတင်ခရက်ဒစ်များရရှိရန် TextToSpeechAI အတွက်မှတ်ပုံတင်, သို့မဟုတ်မလိုအပ်တဲ့ signup နဲ့ GPT-SoVITS ကိုစမ်းသပ်ဖို့ demo ကိုတိုက်ရိုက် jump.
-
2
GPT-Sovits ကိုရွေးပြီး ရည်ညွှန်း clip ကိုတင်ပါ
သင့်ရဲ့အင်ဂျင်အဖြစ် GPT-Sovits ကိုရွေးချယ်ပါ, ထိုအခါ upload ကို 3-10 သင် clone ချင်တဲ့အသံ၏ဒုတိယအညွှန်းကိန်း clip ကို. ထို clip ၏ transcript ကိုထည့်သွင်းခြင်းကအသစ်စက်စက်ပေး, အများဆုံးတိကျတဲ့ clone.
-
3
စာသားကို ထည့်ပါ
GPT-SoVITS တရုတ်, အင်္ဂလိပ်, ဂျပန်, ကိုရီးယား, နှင့်ကွန်တိုနီယမ်, အခြားဘာသာစကားတစ်ခုတွင်အညွှန်းကိန်းမှ cross-language clone အပါအဝင်ထောက်ခံ.
-
4
အသံဖိုင်ကို ထုတ်လုပ်ပါ
GPT-SoVITS အကြားအမြန်နှုန်းမှာအလွန်ကောင်းမွန်တဲ့အရည်အသွေးကို cloned စကားပြော renders, အတူ 25 credits per billed 1,000 characters.
-
5
API ကို download လုပ်ပါ
သင့်ရဲ့ပြီးဆုံး GPT-Sovits အသံဖိုင်အဖြစ် download, သို့မဟုတ်ထုတ်လုပ်မှု workflows အတွက် api.texttospeechai.com မှာ TextToSpeechAI REST API ကိုမှတဆင့်မျိုးဆက်ကို automate.
GPT-Sovits API
TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSovits audio ကို၏စက္ကန့်အနည်းငယ်မှသာအမြင့်ဆုံးအရည်အသွေးအသံ clone ကိုထုတ်လုပ်သည်။",
"voice": "en_US-lessac-medium"
}'
မေးလေ့ရှိသောမေးခွန်းများ
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25