သက်တောင့်သက်သာအသံ ၂

Premium

ဘာသာစကားများစွာဖြင့်

Fast အမြန်နှုန်း
Very Good အရည်အသွေး
အင်း ကူးယူခြင်း
5 ဘာသာစကားများ

အကြောင်း သက်တောင့်သက်သာအသံ ၂

-to-voice communications. The CosyVoice2 is the first speech synthesis model to be fully integrated with the

အဓိကအင်္ဂါရပ်များ

Zero-Shot အသံခိုးယူခြင်း

3-10 စက္ကန့်အမြင့်ဆုံးအရည်အသွေးနှင့်အတူအသံကို reference ကိုမှမည်သည့်အသံကို clone ။

ဘာသာစကား များစွာ

တရုတ်, အင်္ဂလိပ်, ဂျပန်, ကိုရီးယား, နှင့် cross-ဘာသာစကား synthesization နှင့်အတူကွန်တိုနာထောက်ခံသည်။

စီးဆင်းမှုထောက်ပံ့မှု

real-time applications များနှင့်အပြန်အလှန်စနစ်များအတွက်အနည်းငယ်-latency streaming mode ကို။

သဘာဝ အသုံးအနှုန်း

မြင့်မားသော prosody ပုံစံထုတ်ခြင်းသည် သဘာဝကျသော အသံထွက်စကားပြောဆိုမှုကို သင့်လျော်သော အသံထွက်ဖြင့် ထုတ်လုပ်သည်။

အသုံးပြုမှုအခြေအနေများ

Multilingual အကြောင်းအရာဖန်တီးမှု အသံထောက်ပံ့ကြေးများ ဘာသာစကားပေါင်းစုံ ဘာသာပြန်ဆိုခြင်း ကိုယ်ပိုင်အသံ အက်ပလီကေးရှင်းများ

ဘယ်လိုအသုံးပြုရမည် သက်တောင့်သက်သာအသံ ၂

  1. 1

    မှတ်ပုံတင်ခြင်းနှင့်အခမဲ့ခရက်ဒစ်တောင်းဆို

    သင်၏စတင် credits ကိုတောင်းဆိုရန်အခမဲ့ TextToSpeechAI အကောင့်တစ်ခုဖန်တီး, သို့မဟုတ်ပထမဦးဆုံး demo ကိုစမ်းသပ်. မည်သည့် GPU သို့မဟုတ်ဒေသခံ CosyVoice2 တပ်ဆင်ရန်လိုအပ်သည် - အားလုံးကျွန်တော်တို့ရဲ့အခြေခံအဆောက်အအုံပေါ်တွင် runs.

  2. 2

    CosyVoice2 ကိုရွေးပြီး ရည်ညွှန်းကော်ပီတစ်ခုထည့်ပါ

    သင့်ရဲ့အင်ဂျင်အဖြစ် CosyVoice2 ကိုရွေးချယ်ပါ, ထို့နောက်သင် clone ချင်တဲ့အသံ၏သန့်ရှင်းသော 3-10 စက္ကန့်အညွှန်းမှတ်တမ်းတင် upload လုပ်ပါ. CosyVoice2 zero-shot multilingual cloning အတွက်ပြောဆိုသူ၏အရည်အသွေးများကိုထုတ်ယူပါလိမ့်မယ်။

  3. 3

    ထောက်ပံ့ထားသော ဘာသာစကားဖြင့် စာသားထည့်ပါ

    အမျိုးအစားသို့မဟုတ်တရုတ်, အင်္ဂလိပ်, ဂျပန်, ကိုရီးယား, သို့မဟုတ် Cantonese တွင်သင်၏စာသားကို paste. CosyVoice2 cross-ဘာသာစကား synthesization ကိုထောက်ခံ, ထိုသို့ cloned အသံကို reference clip မှကွဲပြားခြားနားသောဘာသာစကားပြောဆိုနိုင်ပါတယ်.

  4. 4

    စကားပြောကို ထုတ်လုပ်ပါ

    click generate and CosyVoice2 synthesizes natural, multilingual speech in the cloned voice, usually within seconds for short text. Premium-tier အသုံးပြုမှုကုန်ကျစရိတ် 25 credits per 1,000 characters.

  5. 5

    API ကို download လုပ်ပါ

    MP3 သို့မဟုတ် WAV အဖြစ်သင်၏သမိုင်းမှပြီးစီးအသံကိုဒေါင်းလုပ်, သို့မဟုတ် TextToSpeechAI REST API ကိုမှတဆင့်အရွယ်အစား CosyVoice2 အသံ clone ကို automate.

သက်တောင့်သက်သာအသံ ၂ API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 zero\u002Dshot voice clone စွမ်းရည်နှင့်အတူသဘာဝဘာသာစကားများစွာပြောဆိုပေးသည်။",
    "voice": "en_US-lessac-medium"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

CosyVoice2 ဟာ FunAudioLLM (Alibaba) ရဲ့ နောက်ဆက်တွဲမျိုးဆက် စာသား-စကားပြောခြင်းနှင့် အသံ cloning ပုံစံတစ်ခုဖြစ်ပါတယ်။ ဒါဟာ reference audio ရဲ့စက္ကန့်အနည်းငယ်မှ zero-shot အသံ clone ကိုထောက်ခံပြီးတရုတ်, အင်္ဂလိပ်, ဂျပန်, ကိုရီးယား, နှင့် Cantonese တွင်သဘာဝစကားပြော synthesize နိုင်ပါတယ်. TextToSpeechAI ပေါ်မှာသင်ကဘယ်နေရာမှာမဆိုဒေသခံ setup ကိုမပါဘဲ browser ထဲမှာ CosyVoice2 ကို run နိုင်ပါတယ်.

ဟုတ်ကဲ့, CosyVoice2 လုံးဝ Apache 2.0 လိုင်စင်ဖြစ်ပါသည် - code ကိုနှင့်မော်ဒယ်အလေးချိန်နှစ်ဦးစလုံး။ ဤသည်စီးပွားရေးလုပ်ငန်းထုတ်ကုန်များတွင်အသုံးပြုရန်လုံခြုံစေသည်, ပေးဆောင် content ကို, နှင့်လိုင်စင်ကြေးသို့မဟုတ် Non-စီးပွားရေးလုပ်ငန်းကန့်သတ်ချက်မရှိဘဲ client ကိုအလုပ်လုပ်.

CosyVoice2 ဘာသာစကားငါးမျိုးကိုထောက်ပံ့ပေးသည်: တရုတ် (Mandarin), အင်္ဂလိပ်, ဂျပန်, ကိုရီးယား, နှင့် Cantonese. ဒါဟာ cross-ဘာသာစကား synthesization ကိုကိုင်တွယ်, ဒါကြောင့်သင်တစ်ဘာသာစကားတွင်မှတ်တမ်းတင်မှအသံကို clone နိုင်ပြီးအခြားစကားပြော generate နိုင်ပါတယ်.

3-10 စက္ကန့်ရည်မှန်းချက်စကားပြောသူ၏သန့်ရှင်းသောအညွှန်းအသံပေးပါ။ CosyVoice2 တစ်ခုအဆုံးမဲ့ scalar quantization နည်းလမ်းကိုအသုံးပြုပြီးစကားပြောသူ၏အရည်အသွေးကို extracts, ထို့နောက်၎င်း၏ထောက်ခံဘာသာစကားများအကြားမည်သည့် cloned အသံမှာအသစ်စကားပြော generates ။ မော်ဒယ်လေ့ကျင့်ရေးသို့မဟုတ် fine-tuning လိုအပ်ပါသည်မဟုတ်။

CosyVoice2 သည် ဘာသာစကားပေါင်းစုံကို ကူးယူ အသုံးပြုနိုင်သော နည်းပညာတစ်ခုဖြစ်ပြီး ရည်ညွှန်း clip တွင် ပါဝင်သော ဘာသာစကားနှင့် မတူသော ဘာသာစကားဖြင့် စကားပြောနေစဉ်တွင်ပင် စကားပြောသူ၏ အမည်ကို ထိန်းသိမ်းပေးနိုင်သည်။

ဟုတ်ကဲ့. CosyVoice2 မြန်နှုန်းမြင့်မော်ဒယ်ဖြစ်ပါသည်နှင့်အနည်းငယ် latency နှင့်အတူအသံထုတ်လုပ်သော streaming mode ကိုပါဝင်သည်, အသံအကူနှင့်အပြန်အလှန် application များအတွက်သင့်လျော်အောင်. အပေါ် TextToSpeechAI မျိုးဆက်များပုံမှန်အားဖြင့်တိုတောင်းသောစာသားအတွက်စက္ကန့်အနည်းငယ်အတွင်းပြီးစီး.

CosyVoice2 အကြောင်းကိုလိုအပ် 4-6GB 0.5B parameter ကိုမော်ဒယ်အတွက် VRAM, ဒါကြောင့် 6GB သို့မဟုတ်ပိုပြီးနှင့်အတူ GPU ကို Self-hosting အခါအကြံပြုသည်။ အပေါ် TextToSpeechAI ပုံစံကျွန်တော်တို့ရဲ့ GPU အခြေခံအဆောက်အအုံပေါ်တွင် runs, ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင်မည်သည့် hardware ကိုမလိုအပ်ပါ.

CosyVoice2 တစ်ဦးပရီမီယံ-tier မော်ဒယ်ဖြစ်ပါသည်နှင့်ကုန်ကျစရိတ် 25 credits per 1,000 characters of text. အားလုံးအသစ်အကောင့်အခမဲ့စတင် credits ရ, သငျသညျပေးဆောင်အစီအစဉ်အပေါ်ဆုံးဖြတ်မတိုင်မီ CosyVoice2 အသံ clone ကိုကြိုးစားနိုင်ပါတယ်ဒါကြောင့်.

နှစ်ဦးစလုံးပရီမီယံအသံ clone အင်ဂျင်များဖြစ်ကြသည်။ GPT-SoVITS မကြာခဏတစ်ဦးတည်းသောရည်မှန်းချက်အသံအတွက်အမြင့်ဆုံးအကြမ်းတူညီမှုရောက်ရှိ, CosyVoice2 multilingual နှင့် cross-ဘာသာစကား clone အတွက်ခိုင်မာသောဖြစ်ပါတယ်နှင့်အနည်းငယ်-latency streaming mode ကိုထည့်သွင်းနေစဉ်။ သင်ဘာသာစကားများစွာပြောဆိုရန်တစ်ဦး cloned အသံလိုအပ်တဲ့အခါ CosyVoice2 ကိုရွေးချယ်ပါ။

CosyVoice2 ဘာသာစကားများ (5 versus2) ထောက်ခံနှင့်အမှန်တကယ်အချိန်အသုံးပြုမှုများအတွက် streaming ကို adds, F5-TTS အင်္ဂလိပ်-သာအလုပ်အကိုင်များအတွက်အနည်းငယ်ပိုမိုမြန်ဆန်နိုင်သည့်အခါ.

TextToSpeechAI သင် MP3 နှင့် WAV ကဲ့သို့သောအများဆုံးပုံစံများ CosyVoice2 မျိုးဆက်များပို့ဆောင်နိုင်ပါတယ်. သင်သည်သင်၏သမိုင်းစာမျက်နှာမှတိုက်ရိုက်ဖိုင်ကိုဒေါင်းလုပ်လုပ်နိုင်သည်သို့မဟုတ် TextToSpeechAI API ကိုမှတဆင့် program ကို retrieve နိုင်ပါတယ်.

ဟုတ်ကဲ့. သင်အခမဲ့ demo နှင့်သင်၏အခမဲ့စတင် credits များအပေါ် CosyVoice2 စမ်းသပ်နိုင်ပါတယ် TextToSpeechAI ဘာမှ install လုပ်ခြင်းမရှိဘဲ. မှတ်ပုံတင်ရုံ, တိုတောင်းသောအညွှန်း clip ကို upload, မည်သည့်ထောက်ခံဘာသာစကားတွင်သင်၏စာသားကိုရိုက်ထည့်, နှင့် generate.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try သက်တောင့်သက်သာအသံ ၂ Now

Generate your first audio free. No credit card required.

Start Free