နေ့

Ultra

စကားပြော-ဦးတည် TTS အသံ clone နှင့်စကားလုံးမဲ့အသံများ

Medium အမြန်နှုန်း
Excellent အရည်အသွေး
အင်း ကူးယူခြင်း
1 ဘာသာစကားများ

အကြောင်း နေ့

ing the most accurate text-to-speech results. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is the most commonly used text-to-speech model in the world. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is the most commonly used text-to-speech model in the world.

အဓိကအင်္ဂါရပ်များ

စကားပြောခန်း ထုတ်လုပ်မှု

ကွဲပြားခြားနားသောအသံများနှင့် turn-ယူခြင်းနှင့်အတူသဘာဝ multi-speaker စကားပြောဆိုမှုထုတ်လုပ်ပါ။

စကားမပြောသော အသံများ

သဘာဝ paralinguistic ထုတ်ဖော်ချက်များအတွက် [ရယ်မော], [အော်], [ကျောက်ကပ်], (gasps) ထည့်သွင်းပါ။

အသံဖမ်းယူခြင်း

5-10 စက္ကန့်အသံကို clone သို့မဟုတ်အသံကို 5-10 စက္ကန့်အသံကို clone

သဘာဝစကားပြောဆိုမှု

1.6B parameters တွေကိုအလွန်သဘာဝစကားပြောprosodyနှင့် intonationထုတ်လုပ်.

အသုံးပြုမှုအခြေအနေများ

စကားပြောနှင့်စကားပြောခြင်းမျိုးဆက် အက္ခရာပေါင်းစုံဖြင့် အသံစာအုပ်ထုတ်လုပ်ခြင်း ဂိမ်းအမည်များ Podcast နှင့် content တည်ဆောက်

ဘယ်လိုအသုံးပြုရမည် နေ့

  1. 1

    အခမဲ့မှတ်ပုံတင်သို့မဟုတ် demo ကိုဖွင့်

    သင်၏စတင်ခရက်ဒစ်ကိုတောင်းဆိုရန်အခမဲ့ TextToSpeechAI အကောင့်တစ်ခုဖန်တီးပါ၊ သို့မဟုတ် Dia စကားပြောခန်းကိုချက်ချင်းစမ်းသပ်ရန် no-signup demo ကိုဖွင့်ပါ။

  2. 2

    Dia အင်ဂျင်ကို ရွေးပါ

    TTS dashboard တွင်အင်ဂျင်စာရင်းမှ Dia ကိုရွေးချယ်ပါ။ Dia သည်စကားပြောခြင်းကို ဦး တည်သော multi-speaker နှင့် voice-cloning ထောက်ခံမှုနှင့်အတူ ultra-tier model ဖြစ်သည်။

  3. 3

    အမှတ်အသားများဖြင့် စကားပြောခန်း စာသားကို ရေးပါ

    အသုံးပြုခြင်းသင်၏စကားပြောကိုဖွဲ့စည်း [S1] နှင့် [S2] တစ်ခုချင်းစီကို Speaker လည်ပတ်အမှတ်အသားပြုရန်, နှင့်ထိုကဲ့သို့သော nonverbal tags များ drop [ရယ်မော], [အော်], [ချောင်းဆိုး], သို့မဟုတ် (gasps) သင်သဘာဝတုံ့ပြန်မှုလိုချင်တဲ့နေရာမှာ.

  4. 4

    အသံဖိုင်ကို ထုတ်လုပ်ပါ

    ကျွန်တော်တို့ရဲ့ hosting GPUs ကိုသင့်ရဲ့ Dia script ကိုပို့ဖို့ generate ကိုနှိပ်ပါ. Dia turn-ယူပြီးတစ်ဦးတည်းအသံဖိုင်ထဲသို့သင်၏ nonverbal tags နဲ့နှစ်ဦးစလုံးပြောဆိုသူစကားပြောဆိုမှုပေးပို့.

  5. 5

    API ကို download လုပ်ပါသို့မဟုတ်ခေါ်ဆိုပါ

    သင့်ရဲ့ရွေးချယ်ထားသော format တွင်ပြီးဆုံးသောစကားပြောကိုဒေါင်းလုပ်လုပ်ပါ၊ သို့မဟုတ်သင့်အကောင့်ကိုသင်၏ token နှင့်အတူ TextToSpeechAI API ကိုတူညီသော [S1] / [S2] script ကိုပို့ခြင်းဖြင့်၎င်းကိုအလိုအလျောက်ပြုလုပ်ပါ။

နေ့ API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] ဟိုင်း! ဒီနေ့ဘယ်လိုနေလဲ? [ရယ်သံများ] [S2] ငါကကြီးမားတဲ့လုပ်နေတာ, မေးဖို့ကျေးဇူးတင်ပါတယ်!",
    "voice": "en_US-lessac-medium"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

Dia သည် Nari Labs မှ 1.6B parameter စကားပြော-ဦးတည် text-to-speech ပုံစံတစ်ခုဖြစ်သည်။ ၎င်းသည် အမျိုးမျိုးသောစကားပြောသူများအတွက်ထောက်ခံမှုနှင့်အတူသဘာဝစကားပြောစကားပြောခြင်း၊ စကားမပြောသောအသံများနှင့်အသံခိုးယူခြင်းအတွက်အထူးပြုသည်။

ဟုတ်ကဲ့, Dia လုံးဝ Apache 2.0 လိုင်စင်ဖြစ်ပါသည် - code ကိုနှင့်မော်ဒယ်အလေးချိန်နှစ်ခုစလုံး. ဒါဟာစီးပွားရေးလုပ်ငန်း applications များမှာအခမဲ့အသုံးပြုနိုင်သည်။

Dia ဟာ အင်္ဂလိပ်စကားပြောကိုသာ ထောက်ခံပေးပါတယ်။

Dia ၏ 1.6B parameter model အတွက် VRAM ၏ 10GB လိုအပ်သည်။ အနည်းဆုံး 12GB နှင့်အတူ GPU သည်အဆင်ပြေသောလုပ်ဆောင်မှုအတွက်အကြံပြုသည်။ TextToSpeechAI တွင်ဤအရာအားလုံးသည်ကျွန်ုပ်တို့၏ hosting GPUs များပေါ်တွင်လည်ပတ်သည်။

ဟုတ်ကဲ့ - စကားပြော Dia အတွက်တည်ဆောက်ထားသည်အမှန်တကယ်ဖြစ်ပါသည်. သင့်ရဲ့ script ကိုထဲမှာ [S1] နှင့် [S2] ပြောင်းခြင်းအားဖြင့်, Dia TTS ကွဲပြားခြားနားသောအသံများနှင့်အမှန်တကယ် turn-ယူခြင်းနှင့်အတူစီးဆင်းနှစ်ဦးစပီကာစကားပြောဆိုမှုထုတ်လုပ်, တစ်ခုတည်းသော-စပီကာ TTS ပုံစံများဖြင့်အောင်မြင်ရန်ခက်ခဲသည်.

Dia တစ်ခုချင်းစီကို tag ကိုတစ်ဦးတည်ငြိမ်အသံကိုအပ်နှံပြီးစကားပြောဆိုမှုလှည့်အဖြစ်သူတို့အကြား switches, ဒါကြောင့် [S1] နှင့် [S2] သင့်ရဲ့စကားပြောခန်းထဲမှာနှစ်ဦးကစာလုံးအဖြစ်အမှုဆောင်.

ဟုတ်ကဲ့။ Dia သည် ရှင်းရှင်းလင်းလင်း ရည်ညွှန်းထားသော အသံ၏ 5-10 စက္ကန့်ခန့်မှ အသံခိုးယူမှုကို ထောက်ပံ့ပေးပြီး သင်သည် စကားပြောသူတစ်ဦးအတွက် တိကျသော အသံကို ပြန်လည်သုံးစွဲနိုင်စေသည်။ သင်သည် စကားပြောခန်းတစ်ခုတွင် ပါဝင်သော စာလုံးတိုင်းသည် သင်ခိုးယူထားသော အသံကဲ့သို့ ထွက်ပေါ်လာစေရန် [S1]/[S2] tags များနှင့်အတူ ခိုးယူမှုကို ပေါင်းစပ်နိုင်သည်။

Dia renders [ရယ်မော], [အော်], [ချောင်းဆိုး], နှင့် (gasps) အဖြစ်သဘာဝ paralinguistic အသံများပြောဆိုစကားထက်စကားလုံးများထဲသို့ထည့်သွင်းဖန်တီး. သင်တုံ့ပြန်မှုလိုချင်သောနေရာတွင် tag ကိုထား - ဥပမာ "[S1] That is hilarious [ရယ်မော]" - စကားပြောပိုမိုလူသားဆန်ခံစားမှုဖြစ်စေရန်.

Dia နှင့် Bark တို့သည် nonverbal အသံများကိုထောက်ခံသော်လည်း Dia သည် [S1] / [S2] turn-taking နှင့် voice cloning တို့နှင့်အတူ multi-speaker စကားပြောဆိုမှုအတွက်ရည်ရွယ်ချက်ရှိရှိတည်ဆောက်ထားသည်။ တကယ့်နှစ်ဦးနှစ်ဖက်စကားပြောဆိုမှုနှင့်စာလုံးအလုပ်အတွက် Dia ကိုရွေးချယ်ပါ။ Bark သည်သင်တစ်ဦးတည်းသောအသံပြောဆိုမှုတွင်ကျယ်ပြန့်သောဘာသာစကားကိုထောက်ပံ့ရန်လိုအပ်သောအခါပိုမိုသင့်လျော်သည်။

Dia သည် ultra-tier engine တစ်ခုဖြစ်သည်, ဒါကြောင့်ဒါဟာကုန်ကျစရိတ် 50 credits per 1,000 characters of generated speech. အဆိုပါ ultra tier သည်ကြီးမားသော 1.6B model နှင့် GPU memory ၏ ~10GB ကိုပြသသည် high-quality dialogue အတွက်အသုံးပြုသည်။

ဟုတ်ကဲ့. အသစ် TextToSpeechAI အကောင့်များအခမဲ့ starter credits များပါဝင်သည်, နှင့်သင်တက်လက်မှတ်ရေးထိုးခြင်းမရှိဘဲ run နိုင်သော demo ရှိပါတယ်. ဤသည်ပေးဆောင်အစီအစဉ်အပေါ်ဆုံးဖြတ်မတိုင်မီ [S1] / [S2] tags များနှင့်အတူအတို Dia စကားပြောဖန်တီးရန်လုံလောက်သည်.

ဟုတ်ကဲ့။ သင်သည်သင်၏အကောင့်စာမျက်နှာမှ API token ကိုရှိပြီးတာနဲ့သင် Dia စကားပြော scripts များကိုတင်သွင်းနိုင်ပါတယ် - [S1] / [S2] ပတ်လည်နှင့် [ရယ်မော] ကဲ့သို့ tags များအပါအဝင် - TextToSpeechAI REST API ကိုနှင့်ရလဒ်အသံကို program အားဖြင့် download လုပ်ပါ။

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try နေ့ Now

Generate your first audio free. No credit card required.

Start Free