ဧရိယာများ

Ultra

ခံစားချက်နှင့်စတိုင်ထိန်းချုပ်မှုနှင့်အတူ Expressive အသံ clone

Medium အမြန်နှုန်း
Excellent အရည်အသွေး
အင်း ကူးယူခြင်း
5 ဘာသာစကားများ

အကြောင်း ဧရိယာများ

s.

အဓိကအင်္ဂါရပ်များ

ခံစားချက်ထိန်းချုပ်မှု

ထိန်းချုပ်စကားပြောခံစားချက်: ပျော်ရွှင်မှု, ဝမ်းနည်းခြင်း, ဒေါသ, ကြောက်ရွံ့, အံ့သြ, နာကျင်မှု, နှင့် neutral ။

အသံဖမ်းယူခြင်း

5-30 စက္ကန့်အမြင့်ဆုံးယုံကြည်မှုနှင့်အတူအသံကိုရည်ညွှန်းမှမည်သည့်အသံကို clone ။

ဖော်ပြချက် စကားပြော

1.6B parameters တွေကို nuanced စိတ်ခံစားမှုပေးပို့ခြင်းနှင့်အတူအလွန်အစွမ်းထက်တဲ့စကားပြောထုတ်လုပ်.

ဘာသာစကား များစွာ

အင်္ဂလိပ်, ဂျပန်, တရုတ်, ပြင်သစ်နှင့်ဂျာမန်ဘာသာစကားများထောက်ခံသည်။

အသုံးပြုမှုအခြေအနေများ

စိတ်ခံစားမှုအရ ဖော်ပြနိုင်သော အကြောင်းအရာဖန်တီးမှု ခံစားချက်များနှင့်အတူဂိမ်းဇာတ်ကောင်အသံများ အသံစာအုပ် ခံစားချက်နှင့်အတူ ပြောပြ အပြန်အလှန်ပြောဆိုမှု အတွေ့အကြုံများ

ဘယ်လိုအသုံးပြုရမည် ဧရိယာများ

  1. 1

    မှတ်ပုံတင်သို့မဟုတ် demo ကိုဖွင့်

    Starter credits တွေကိုရဖို့အခမဲ့ TextToSpeechAI အကောင့်တစ်ခုဖန်တီး, သို့မဟုတ် Zonos ချက်ချင်းစမ်းသပ်ဖို့မရှိ-signup demo ကိုအသုံးပြုပါ။

  2. 2

    Zonos engine ကိုရွေးပါ

    အသံနှင့်မော်ဒယ် picker မှ Zonos ကိုရွေးချယ်ပါ။ အသံကို clone လုပ်ရန်အတွက် Zonos သည် Speaker ကိုလိုက်ဖက်စေရန်အတွက် 5-30 စက္ကန့်အကွာတွင် Clean Reference Audio ကို upload လုပ်ပါ။

  3. 3

    စာသားကို ထည့်ပါ

    Zonos အင်္ဂလိပ်, ဂျပန်, တရုတ်, ပြင်သစ်, နှင့်ဂျာမန်အကြားအလုပ်လုပ်.

  4. 4

    ခံစားချက်တစ်ခုကိုရွေးပြီးထုတ်လုပ်ပါ

    ၇ မျိုးရှိသော Zonos ခံစားချက်များထဲမှ တစ်ခုကို ရွေးချယ်ပါ။ ဥပမာ- neutral, happiness, sadness, anger, fear, surprise, or disgust။

  5. 5

    API ကို download လုပ်ပါ

    ပြန်လည်ကစားခြင်းနှင့်ပြီးဆုံးအသံကို download လုပ်ပါ, သို့မဟုတ်အလိုအလျောက်အလုပ်လုပ်ကိုင်မှုအတွက် TextToSpeechAI REST API ကိုမှတဆင့် program ကိုအတူတူ Zonos engine ကိုခေါ်ဆို.

ဧရိယာများ API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Zonos သည် ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ မယုံနိုင်လောက်အောင် ဖော်ပြနိုင်သော စကားပြောကို ထုတ်လုပ်သည်။",
    "voice": "en_US-lessac-medium"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

Zonos သည် Zyphra မှ 1.6B parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်းသည် fine-grained emotion control နှင့် high-fidelity voice cloning တို့နှင့်အတူ ထုတ်ဖော်ပြောဆိုမှုမျိုးဆက်သစ်တွင် အထူးပြုသည်။ TextToSpeechAI တွင် ၎င်းသည် အများဆုံး nuanced, စိတ်ပိုင်းဆိုင်ရာ ချမ်းသာသော audio အတွက် ultra-tier engine အဖြစ် လည်ပတ်သည်။

ဟုတ်ကဲ့. Zonos Apache 2.0 လိုင်စင်အောက်တွင်ထုတ်လွှင့်သည် ၎င်း၏ကုဒ်နှင့်မော်ဒယ်အလေးချိန်နှစ်ခုစလုံးအတွက်, ဒါကြောင့်၎င်းသည် attribution သို့မဟုတ် Non-ကုန်သွယ်မှုကန့်သတ်ချက်မရှိဘဲစီးပွားရေးလုပ်ငန်းထုတ်ကုန်များတွင်အခမဲ့အသုံးပြုနိုင်ပါတယ်. ပေးဆောင် apps များ, client ကိုအလုပ်, နှင့် monetized အကြောင်းအရာများအတွက်လုံခြုံစေသည်.

Zonos ၇ ခံစားမှုပြည်နယ်များ - neutral, ပျော်ရွှင်မှု, ဝမ်းနည်းမှု, ဒေါသ, ကြောက်ရွံ့, အံ့သြစရာ, နှင့် disgust - သင် generate လုပ်ဖို့မတိုင်မီရွေးချယ်ကြောင်းပြသ. ရွေးချယ်ထားသောစိတ်ခံစားမှုအပေါ်၎င်း၏ပေးပို့မှုအတွက်ပုံစံအခြေအနေများ, ပြောင်းရွှေ့အသံ, ခြေလှမ်း, နှင့်အသံသွင်းခြင်းကိုတူညီတဲ့ဝါကျပျော်ရွှင်သို့မဟုတ်ဒေါသထွက်သံကိုဖြစ်စေနိုင်ပါတယ်. ဤသည် Zonos တစ်ဦးအထူးစိတ်နေစိတ်ထားလိုအပ်သော character voices နှင့်စကားပြောများအတွက်အလွန်အစွမ်းထက်တဲ့ဖြစ်စေ.

Zonos လေးခုစိတ်ခံစားမှုရွေးချယ်စရာထောက်ခံ: neutral, ပျော်ရွှင်မှု, ကြေကွဲမှု, ဒေါသ, ကြောက်ရွံ့, အံ့သြ, နှင့် disgust. သင်တစ်ဦးလုံး clip ၏စိတ်ခံစားမှု tone ကိုသတ်မှတ်ရန်မျိုးဆက်တစ်ဦးရွေး.

ဟုတ်ကဲ့. Zonos ကလပ်အသံကို reference audio ၏5-30 စက္ကန့်မှတစ်ဦးအသံ, speaker ရဲ့အရည်အသွေးတွေကို extracting နှင့်အသစ်စကားပြောထဲမှာသူတို့ကို reproducing. သင် cloned အသံအသံပျော်ရွှင်စေရန်ရှစ်စိတ်ခံစားမှုထဲကတစ်ခုခုနှင့်အတူ cloning ကိုပေါင်းစပ်နိုင်ပါတယ်, ဒေါသ, သို့မဟုတ်ကြောက်ရွံ့.

Zonos ဘာသာစကားငါးမျိုးကိုကိုင်တွယ်: အင်္ဂလိပ်, ဂျပန်, တရုတ်, ပြင်သစ်, နှင့်ဂျာမန်။ Emotion control နှင့် voice cloning ဤဘာသာစကားအားလုံးအကြားအလုပ်လုပ်.

Zonos ကြောင့်၎င်း၏ 1.6B parameter ကိုအရွယ်အစားအလယ်အလတ်မြန်နှုန်းတွင် runs, ထူးချွန်, အလွန်အစွမ်းထက်တဲ့ထုတ်လုပ်မှုအတွက်ကုန်သွယ်မှုကုန်ကြမ်း throughput ကို။ အရည်အသွေးစိတ်ခံစားမှုနှင့် cloned စကားပြောဆိုမှုများအတွက်အကောင်းဆုံးအကြားဖြစ်ပါသည်, ဒါကြောင့်ဒါဟာ bulk real-time generation ကိုထက်နောက်ဆုံးထုတ်လုပ်မှုအသံကို fits ။

Zonos လိုအပ် 8GB သို့မဟုတ်ပိုပြီး VRAM ၏၎င်း၏ 1.6B parameter ကိုမော်ဒယ်အတွက်. အနည်းဆုံး 10GB နှင့်အတူ GPU ကိုစိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူအသံ clone ကိုပေါင်းစပ်တဲ့အခါအဆင်ပြေစွာလုပ်ဆောင်နိုင်ရန်အတွက်အကြံပြုထားသည်။ အပေါ် TextToSpeechAI အားလုံးဤသည်ကျွန်တော်တို့ရဲ့ GPU backend ပေါ်တွင် runs, ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင် hardware ကိုမလိုအပ်ပါဘူး.

Zonos သည် ultra-tier engine တစ်ခုဖြစ်ပြီး 50 credits per 1,000 characters များဖြင့် ငွေပေးချေသည်။ အဆိုပါ ultra tier သည် StyleTTS2, Tortoise နှင့် OpenVoice ကဲ့သို့တူညီသော tier တွင်၎င်း၏ကြီးမားသောမော်ဒယ်နှင့်အဆင့်မြင့်စိတ်ခံစားမှုနှင့် clone စွမ်းရည်များကိုပြသသည်။

Zonos ဟာ 7-state ခံစားမှု အမျိုးအစား 7-type တွေကို ပေးနိုင်ပြီး ခေတ်မီ 1.6B architecture ကို ပေးနိုင်ပါတယ်။ OpenVoice ကတော့ သူငယ်ချင်းကောင်း၊ ပျော်ရွှင်စရာ၊ အလွန်မြန်ဆန်တဲ့ instant clone တွေနဲ့ တိတ်တိတ်လေး ခံစားမှု အမျိုးအစား 7-type တွေကို ပေးနိုင်ပါတယ်။

Zonos ရှင်းလင်းပြတ်သားတဲ့စိတ်ခံစားမှုရွေးချယ်မှုအပေါ်ရုံး plus အားကောင်းတဲ့ single-voice clone, သင်တစ်ဦးချင်းစီ clip ၏စိတ်နေစိတ်ထားအပေါ်တိကျတဲ့ထိန်းချုပ်မှုပေး. သင်စိတ်ခံစားမှု tags တွေကိုလိုအပ်ပါသလားကိုက်ညီတဲ့အင်ဂျင် Pick, စကားပြောဆိုမှုလှည့်, သို့မဟုတ် selectable စိတ်ခံစားမှု.

ဟုတ်ကဲ့. အသစ် TextToSpeechAI အကောင့်များအခမဲ့စတင်ခရက်ဒစ်ရ, နှင့် demo သင် sign up မပါဘဲနမူနာအသံဖိုင်ကို generate လုပ်ပေးသည်. ဤသည် Zonos စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အသံ clone ကိုစမ်းသပ်ဖို့လုံလောက်တဲ့အပိုဆုကြေးငွေဝယ်ယူမတိုင်မီဖြစ်ပါသည်.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try ဧရိယာများ Now

Generate your first audio free. No credit card required.

Start Free