OpenVoice ခေါ်ဆိုမှု

Ultra

Granular Tone Control နှင့်အတူချက်ချင်းအသံ Cloning

Moderate အမြန်နှုန်း
Very Good အရည်အသွေး
အင်း ကူးယူခြင်း
10 ဘာသာစကားများ

အကြောင်း OpenVoice ခေါ်ဆိုမှု

of the voice and apply it to the speaking style of the person you are cloning. OpenVoice is the only voice clone model that allows you to clone voices fromaperson's voice, without having to createanew reference audio. OpenVoice is the only voice clone model that allows you to clone voices fromaperson's voice, without having to createanew reference audio.

အဓိကအင်္ဂါရပ်များ

ချက်ချင်း ကူးယူခြင်း

အသံ၏စက္ကန့်အနည်းငယ်မှမည်သည့်အသံကိုမဆိုခိုးယူပါ

အသံထိန်းချုပ်မှု

ပျော်ရွှင်သော, ကြေကွဲ, ဒေါသ, စိတ်လှုပ်ရှား, သို့မဟုတ်အသံတိတ်အသံများလျှောက်ထား.

ပုံစံ လွှဲပြောင်းခြင်း

ပြောင်းလွယ်ပြင်လွယ်အတွက်ပြောဆို style မှအသံအမည်ကိုခွဲခြား.

ဘာသာစကားပေါင်းစုံ

ဘာသာစကားအမျိုးမျိုးအကြားမှာ ကူးယူထားသော အသံများကို အသုံးပြုပါ။

မြန်ဆန်စွာ စီမံခြင်း

အမြန်အသံထုတ်လုပ်မှုအတွက်ထိရောက်သောကောက်ချက်ချခြင်း။

ရင်းမြစ် ဖွင့်

MIT စီးပွားရေးလုပ်ငန်း applications များအတွက်လိုင်စင်။

အသုံးပြုမှုအခြေအနေများ

စိတ်ခံစားမှုဆိုင်ရာ အကြောင်းအရာများ စာလုံး လှုပ်ရှားမှု အပြန်အလှန်ဆက်သွယ်မှုဂိမ်းများ အသံစာအုပ် ပြောပြချက် ရောင်းချမှုဗီဒီယိုများ အသွင်ပြောင်း အကူများ

ဘယ်လိုအသုံးပြုရမည် OpenVoice ခေါ်ဆိုမှု

  1. 1

    အခမဲ့မှတ်ပုံတင်သို့မဟုတ် demo ကိုစမ်းသပ်

    Starter Credits များရယူရန်အခမဲ့ TextToSpeechAI အကောင့်တစ်ခုဖန်တီးပါ၊ သို့မဟုတ် committing မတိုင်မီ OpenVoice ကိုကြားရန် on-page demo ကိုအသုံးပြုပါ။ ကျွန်ုပ်တို့၏ server များပေါ်တွင်အားလုံးကို run သည့်အတွက် ပြည်တွင်း GPU သို့မဟုတ် install လုပ်ရန်မလိုပါ။

  2. 2

    OpenVoice ကိုရွေးပြီး ရည်ညွှန်းဗီဒီယိုဖိုင်ကို တင်ပါ

    OpenVoice engine ကိုရွေးချယ်ပါ, ထို့နောက်ချက်ချင်းရည်မှန်းချက်အသံကို clone ရန်ရှင်းရှင်းလင်းလင်းအညွှန်းအသံ၏စက္ကန့်အနည်းငယ် upload လုပ်ပါ။ OpenVoice သင်မည်သည့်စာသားနှင့်အသံကိုကျော် reuse နိုင်အောင်ပြောဆိုသူအမည်ကို captures ။

  3. 3

    စာသားကို ထည့်ပါ

    OpenVoice ဟာ 10 ဘာသာစကားတွေနဲ့ cross-language delivery ကိုထောက်ပံ့ပေးပါတယ်။ ဒါကြောင့် သင့်အနေနဲ့ reference clip ထက် အခြားဘာသာစကားနဲ့ ရေးသားနိုင်မှာပါ။

  4. 4

    အသံပုံစံကိုရွေးပြီး ထုတ်လုပ်ပါ

    ၉ OpenVoice အသံစတိုင်များထဲကတစ်ခုကိုရွေးချယ်ပါ - default, ဖော်ရွေ, ပျော်ရွှင်, စိတ်လှုပ်ရှား, ကြေကွဲ, ဒေါသ, စိုးရိမ်ပူပန်, အော်ဟစ်, သို့မဟုတ်အသံတိတ် - ထို့နောက်ထုတ်လုပ်. ထို့အတူ cloned အသံသည်စိတ်ခံစားမှုပေးပို့ခြင်းနှင့်အတူပြောဆိုလိမ့်မည်။

  5. 5

    API ကို download လုပ်ပါ

    MP3 အဖြစ်သင်၏အသံကို download, WAV, သို့မဟုတ် OGG, သို့မဟုတ် TextToSpeechAI API ကိုမှတဆင့်မျိုးဆက်ကို automate တစ်ခုချင်းစီကိုတောင်းဆိုမှုအတွက်သင်၏ cloned အသံနှင့် tone style ကိုဖြတ်သန်းခြင်းအားဖြင့်.

OpenVoice ခေါ်ဆိုမှု API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice သည် ပျော်ရွှင်မှု၊ ဝမ်းနည်းမှု၊ သို့မဟုတ် လျှို့ဝှက်စွာပြောဆိုခြင်း စသည့် မည်သည့်အသံဖြင့်မဆို ပြောဆိုနိုင်သည်။",
    "voice": "en_US-lessac-medium"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

OpenVoice ဟာ စကားပြောစတိုင်ကနေ ထူးခြားစွာ အသံအမည်ကို ခွဲခြားပေးနိုင်တဲ့ တိုးတက်လာတဲ့ စာသား-စကားပြော-စကားပြောနဲ့ အသံ clone နည်းပညာဖြစ်ပါတယ်။ ဒါကြောင့် သင့်အနေနဲ့ အသံကို clone လုပ်ပြီး ခံစားချက်အလိုက် အသံအသစ်ကို လိုအပ်ခြင်းမရှိဘဲ ကွဲပြားခြားနားတဲ့ စိတ်ခံစားမှု အသံတွေကို အသုံးပြုနိုင်မှာ ဖြစ်ပါတယ်။

ဟုတ်ကဲ့, OpenVoice ရည်ညွှန်းအသံ၏စက္ကန့်အနည်းငယ်မှချက်ချင်းအသံ clone လုပ်ဆောင် - သင်တန်းမလိုအပ်တဲ့ run မလိုပါ။ အသံ capture လုပ်ပြီးတာနဲ့, OpenVoice သင်ရွေးချယ်ထားတဲ့မည်သည့်စာသားနှင့်မည်သည့် tone style ကိုကျော်ပြီးထိုအမည်ကို reuse နိုင်ပါတယ်.

OpenVoice ဟာ tone ပြောင်းပြန်ကနေအခြေခံစကားပြော synthesized ခွဲခြားတဲ့နှစ်ဆင့်အဆောက်အအုံကိုအသုံးပြုပါတယ်။ အသံကို clone လုပ်ပြီးနောက်၊ သင်9tone styles ထဲကတစ်ခုခုကို အသုံးပြုနိုင်ပါတယ် – default, ခင်မင်ရင်းနှီး, ပျော်ရွှင်, စိတ်လှုပ်ရှား, ကြေကွဲ, ဒေါသ, စိုးရိမ်, အော်ဟစ်, သို့မဟုတ် whispering – နှင့်တူညီ cloned အသံ re-recording မပါဘဲသင်ရွေးချယ် tone ကိုအခြေခံပြီးကွဲပြားခြားနားပြောဆို။

OpenVoice ၉ မျိုးပြောဆိုမှုပုံစံများကိုထောက်ပံ့ပေးသည်: default, ဖော်ရွေ, ပျော်ရွှင်, စိတ်လှုပ်ရှား, ကြေကွဲ, ဒေါသ, စိုးရိမ်ပူပန်, အော်ဟစ်, နှင့်အသံတိတ်။ တစ်ခုချင်းစီကိုပုံစံကို cloned speaker အမည်ကိုထိန်းသိမ်းထားစဉ်စိတ်ခံစားမှုပေးပို့ reshapes, လိုင်းဖတ်ရှုသည်မည်သို့အပေါ်သင်ပေးသော fine-grained ထိန်းချုပ်မှု။

OpenVoice သည် MIT လိုင်စင်အောက်တွင် လွတ်လပ်သော ရင်းမြစ်ဖြစ်သောကြောင့် စီးပွားရေးလုပ်ငန်းများအတွက် အခမဲ့ အသုံးပြုနိုင်သည်။ မည်သည့် မျိုးပွားမှုပုံစံနှင့်မဆို သင့်တွင် စီးပွားရေးလုပ်ငန်းများအတွက် မျိုးပွားမှုပြုလုပ်သည့် အသံတစ်ခုခုအတွက် သင့်လျော်သော ပိုင်ဆိုင်ခွင့်ရှိကြောင်း သေချာစေပါ။

OpenVoice ပတ်ဝန်းကျင်ထောက်ခံ 10 အင်္ဂလိပ်, တရုတ်, ဂျပန်, ကိုရီးယား, နှင့်ဥရောပဘာသာစကားများအပါအဝင်ဘာသာစကားများ. ဒါဟာ cross-ဘာသာစကား cloning ကိုလည်းပေး, ဒါကြောင့်သင်တစ်ဘာသာစကားတွင်အသံကို clone နိုင်ပြီးအခြားတစ်ဦးက၎င်းကိုသဘာဝအားဖြင့်ပြောဆိုနိုင်ပါတယ်.

OpenVoice သည်အလွန်အမင်းမျိုးဆက်အမြန်နှုန်းရှိပြီး GPU တစ်ခုပေါ်တွင် 2-4 စက္ကန့်အတွင်းတွင်အပိုဒ်တစ်ပုဒ်ကိုပုံမှန်အားဖြင့်ပေးပို့သည်။ ထုတ်လုပ်မှုအရည်အသွေးသည်အလွန်ကောင်းသည်။ ရှင်းလင်းသောအသံထုတ်လုပ်မှုနှင့်အသံလွှဲပြောင်းခြင်းဖြင့်စကားပြောသူ၏အမည်ကိုမပျက်စီးစေဘဲစိတ်ခံစားမှုပေးပို့မှုကိုယုံကြည်စိတ်ချစွာပြောင်းလဲနေစဉ်တွင်ထိန်းသိမ်းထားသည်။

OpenVoice အများအားဖြင့်လိုအပ်ပါတယ် 6-8GB VRAM ၏ batch အရွယ်အစားနှင့်အသံပြောင်းပြန် load ကိုပေါ် မူတည်. ဒါဟာအထက်အလယ်အလတ်-range GPUs ကိုအလယ်အလတ်-range အပေါ်အဆင်ပြေပြေ run နိုင်ပါတယ်, နှင့်အပေါ် TextToSpeechAI အားလုံးဤသည်ကျွန်တော်တို့ရဲ့ဆာဗာများပေါ်တွင်ကိုင်တွယ်သည်သင်မည်သည့်ဒေသခံ hardware ကိုမလိုအပ်ပါဘူးဒါကြောင့်.

OpenVoice သည် Ultra-tier engine တစ်ခုဖြစ်ပြီး 50 credits per 1000 characters တွင်စျေးနှုန်းသတ်မှတ်ထားသည်။ Ultra tier သည်၎င်း၏ advanced tone control နှင့် clone plus style-conversion pipeline အတွက်လိုအပ်သောအပို compute ကိုပြသသည်။

OpenVoice သည်၎င်း၏အသံနှင့်စတိုင်ထိန်းချုပ်မှုအတွက်ထူးခြားသည်: သင်သည်တစ်ဦး cloned အသံကိုယူပြီးပျော်ရွှင်စွာအဖြစ် re-ပေးပို့နိုင်သည်, ဝမ်းနည်း, ဒေါသ, သို့မဟုတ်အသံတိတ်။ F5-TTS သည်ပိုမိုမြန်ဆန်ပြီးသဘာဝ, neutral စကားပြောအတွက်ကျွန်ုပ်တို့၏ default cloning engine ဖြစ်သည်။ သင်စိတ်ခံစားမှုစတိုင်ထိန်းချုပ်မှုလိုအပ်တဲ့အခါ OpenVoice ကိုရွေးချယ်ပါ၊ သင်အမြန်ဆုံးသဘာဝ clone ကိုလိုချင်တဲ့အခါ F5-TTS ကိုရွေးချယ်ပါ။

ရည်ညွှန်းအသံ upload တင်ခြင်းအားဖြင့် cloned အသံတစ်ခုဖန်တီး, ထို့နောက်သင့်ရဲ့ API ကိုတောင်းဆိုချက်မှာ tone style ကိုသတ်မှတ်. အဆိုပါ API ကို cloned အသံကိုသင်၏ရွေးချယ်ထားသောစိတ်ခံစားမှု tone ကိုအလိုအလျောက်နှင့် MP3 တွင်အသံပြန်လာသင့်ရဲ့လျှောက်ထား, WAV, သို့မဟုတ် OGG format ကို.

ဟုတ်ကဲ့. starter credits ရရှိရန်နှင့် OpenVoice clone နှင့် tone control ကိုစမ်းသပ်ရန်အခမဲ့ TextToSpeechAI အကောင့်အတွက်မှတ်ပုံတင်ပါ, သို့မဟုတ်ပထမဦးဆုံး on-page demo ကိုအသုံးပြုပါ။ ပြည်တွင်း set up မရှိပါ - reference clip ကို upload လုပ်ပါ၊ tone ကိုရွေးပါ၊ browser တွင် generate လုပ်ပါ။

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice ခေါ်ဆိုမှု Now

Generate your first audio free. No credit card required.

Start Free