TTS စတိုင် ၂

Ultra

ပုံစံပြောင်းခြင်းနှင့်အတူလူသား-အဆင့်စာသား-to-စကားပြော

Moderate အမြန်နှုန်း
Excellent အရည်အသွေး
အင်း ကူးယူခြင်း
1 ဘာသာစကားများ

အကြောင်း TTS စတိုင် ၂

s. StyleTTS 2 is the first TTS system to use the

အဓိကအင်္ဂါရပ်များ

လူသားအဆင့် အရည်အသွေး

မျက်စိမှိတ်စစ်ဆေးမှုတွင် လူသားမှတ်တမ်းတင်မှုမှ ခွဲခြားမပြနိုင်သော စကားပြောကို ထုတ်လုပ်သည်။

ပုံစံ လွှဲပြောင်းခြင်း

အသံနမူနာမှ စကားပြောစတိုင်ကို ကူးယူပါ

သဘာဝ အသုံးအနှုန်း

ပြီးပြည့်စုံသောဂီတ, ဖိအား, diffusion-based modeling နှင့်အတူအသံသွင်း.

အသံဖမ်းယူခြင်း

ထူးခြားတဲ့တိကျမှုနှင့်သဘာဝကျကျအသံများ clone ။

အမြန်ဆုံး ကောက်ချက်ချခြင်း

အရည်အသွေးထိန်းသိမ်းနေစဉ် autoregressive ပုံစံများထက်ပိုမိုမြန်ဆန်။

ရင်းမြစ် ဖွင့်

MIT လိုင်စင်နှင့်အတူအပြည့်အဝစီးပွားရေးအသုံးပြုခွင့်ရှိသည်။

အသုံးပြုမှုအခြေအနေများ

Premium အသံစာအုပ်များ ပရော်ဖက်ရှင်နယ် အသံသွင်း ရုပ်ရှင် & TV ထုတ်လုပ်မှု High-End ကြော်ငြာ Podcast ထုတ်လုပ်မှု အသံ ပါဝင်မှု

TTS စတိုင် ၂ Voices

View All 6
StyleTTS2 Default
EN
StyleTTS2 Expressive
EN
StyleTTS2 Fast
EN
StyleTTS2 Natural
EN
StyleTTS2 Neutral
EN
StyleTTS2 Quality
EN

ဘယ်လိုအသုံးပြုရမည် TTS စတိုင် ၂

  1. 1

    အခမဲ့မှတ်ပုံတင်သို့မဟုတ် demo ကို run

    Starter Credits ရယူရန် အခမဲ့ TextToSpeechAI Account တစ်ခု ဖန်တီးပါ။ သို့မဟုတ် Homepage Demo ကိုအသုံးပြုပြီး StyleTTS2 ကို နားထောင်ပါ။

  2. 2

    StyleTTS2 အင်ဂျင်ကို ရွေးပါ

    အသံစာအုပ်ဆိုင်မှ StyleTTS2 အသံကို ရွေးချယ်ပါ။ အသံကို ကူးယူရန်အတွက် 10-30 စက္ကန့် reference clip ကို upload လုပ်ပါ။ StyleTTS2 က ၎င်း၏ style ကို ကူးယူသွားပါလိမ့်မယ်။

  3. 3

    စာသားကို ထည့်ပါ

    StyleTTS2 အင်္ဂလိပ်မှာ excels နှင့်သဘာဝ prosody ပေးပို့, ဖိအား, နှင့်ရှည်လျားသော passages ကျော် intonation.

  4. 4

    အသံဖိုင်ကို ထုတ်လုပ်ပါ

    Click generate and TextToSpeechAI renders your StyleTTS2 audio on GPU. Ultra-tier StyleTTS2 costs 50 credits per 1000 characters.

  5. 5

    API ကို download လုပ်ပါ

    MP3 အဖြစ်ပြီးစီး StyleTTS2 အသံဖိုင်ကိုဒေါင်းလုပ်, WAV, သို့မဟုတ် OGG, သို့မဟုတ် generation ကို automate ရန်သင်၏ StyleTTS2 အသံနှင့်အတူ TextToSpeechAI API ကိုခေါ်ဆို.

TTS စတိုင် ၂ API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "StyleTTS2ဒါကြောင့်သဘာဝစကားပြောထုတ်လုပ်, ဒါဟာပရော်ဖက်ရှင်နယ်လူသားမှတ်တမ်းတင် rivals.",
    "voice": "styletts2-default"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

StyleTTS2 သည် လူသားအဆင့် စကားပြောခြင်းကို ပေါင်းစပ်နိုင်သော State-of-the-art text-to-speech model တစ်ခုဖြစ်သည်။ အမြင်အာရုံမမြင်ရသော နားထောင်ခြင်းစမ်းသပ်မှုတွင် အမှန်တကယ် လူသားများမှ မှတ်တမ်းတင်ထားသော စကားပြောသံကို ခွဲခြားနိုင်ရန်အတွက် Style diffusion နှင့် Adversarial training ကို အသုံးပြုသည်။ TextToSpeechAI တွင် StyleTTS2 ကို အခမဲ့ အသုံးပြုနိုင်ပါသည်။

StyleTTS2 အပေါ်ရရှိနိုင်အမြင့်ဆုံးအရည်အသွေး TTS audio ကိုထုတ်လုပ် TextToSpeechAI. ဥပဒေရေးရာအကဲဖြတ်မှုတွင်၎င်းသည် MOS (အကြားအမြင် Score) လေ့လာမှုများအပေါ်လူသားအဆင့်အတန်း ratings ကိုရောက်ရှိ, နားထောင်သူမကြာခဏအစစ်အမှန်လူသားစကားပြောသူမှခွဲခြားနိုင်ခြင်းမရှိ. ဒါဟာဒီအကြောင်းပြချက်အတွက် Tortoise အတူတကွကျွန်တော်တို့ရဲ့ Ultra tier မှာထိုင်.

ဟုတ်ကဲ့, StyleTTS2 style transfer မှတဆင့်အသံ clone ကိုထောက်ခံ. ဒါဟာအသံကိုသာမဟုတ်ဘဲပြောဆိုပုံစံများ extracts, စည်းချက်, နှင့်အညွှန်းကိန်း clip မှစိတ်ပိုင်းဆိုင်ရာအရည်အသွေး. ပေး 10-30 အများဆုံးတိကျတဲ့ StyleTTS2 clone အတွက်ရှင်းလင်းသောအသံ၏စက္ကန့်.

ဟုတ်ကဲ့. StyleTTS2 ခွင့်ပြု MIT လိုင်စင်အောက်တွင်ထုတ်လွှင့်သည်, မည်သည့် royalties များနှင့်အတူအပြည့်အဝစီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြုသော. အသံစာအုပ်များအတွက်လုံခြုံစေသည်, ကြော်ငြာ, ရုပ်ရှင်, နှင့်အခြားပရော်ဖက်ရှင်နယ် StyleTTS2 စီမံကိန်းများအခွင့်အရေးကိစ္စရှိရာ.

StyleTTS2 အင်္ဂလိပ်ဘာသာစကားကိုအဓိကအားထောက်ခံ, ပုံစံအင်္ဂလိပ် dataset အပေါ်လေ့ကျင့်ခဲ့သည်ကတည်းက. သင်ဘာသာစကားများစွာအကြားတူညီသောအရည်အသွေးလိုအပ်လျှင်, TextToSpeechAI အပေါ် F5-TTS အသံ clone ကိုထောက်ခံနေစဉ်ပိုကောင်း fit ဖြစ်ပါတယ်။

StyleTTS2 ပျမ်းမျှမျိုးဆက်အမြန်နှုန်းရှိပါတယ်. ဒါဟာ Tortoise ကဲ့သို့ autoregressive ပုံစံများထက်အများကြီးပိုမြန်ပေမယ့် Piper ကဲ့သို့အလေးချိန်အနည်းငယ်အင်ဂျင်ထက်နှေး. ၎င်း၏ပရီမီယံအရည်အသွေးနှင့် compute ကုန်ကျစရိတ်ကြောင့်, StyleTTS2 ကျွန်တော်တို့ရဲ့ Ultra tier မှာစျေးနှုန်းမဟုတ်ဘဲတစ်ဦး real-time ပုံစံအဖြစ်ဖြစ်ပါတယ်။

StyleTTS2 လိုအပ်သည်အကြမ်းဖျင်း 4-6GB ကို VRAM ၏အယူအဆအတွက်. ဒါဟာပိုမိုမြင့်မားသောအရည်အသွေး output ကိုထုတ်လုပ်နေစဉ် Bark သို့မဟုတ် Tortoise ထက်ပိုမို memory-ထိရောက်သောဖြစ်ပါသည်. အပေါ် TextToSpeechAI အားလုံး StyleTTS2 စီမံခန့်ခွဲမှုကျွန်တော်တို့ရဲ့ GPUs ပေါ်မှာ runs, ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင်မည်သည့် hardware ကိုလိုအပ်ပါတယ်မဟုတ်.

StyleTTS2 တစ်ဦး Ultra-tier မော်ဒယ်ဖြစ်ပါသည်နှင့်ကုန်ကျစရိတ် 50 credits per 1000 characters on TextToSpeechAI. ထိုပရီမီယံစျေးနှုန်းသတ်မှတ်ချက်၎င်း၏လူ့-အဆင့်အရည်အသွေးနှင့်လိုအပ်သော GPU ကိုရင်းမြစ်များကိုထင်ဟပ်. Piper ကဲ့သို့စံပြမော်ဒယ်များကုန်ကျစရိတ် 10 credits per 1000 characters by comparison.

ရွေးချယ် StyleTTS2 အခါအကြမ်းအင်္ဂလိပ်အသံအရည်အသွေးထိပ်တန်းအလေးပေးနှင့်သင်အများဆုံးသဘာဝ-အသံထွက်ရလဒ်ကိုလိုချင်. သင် voice clone နှင့်အတူမြန်ဆန်သောဘာသာစကားများစွာ synthesization လိုအပ်တဲ့အခါ F5-TTS ကိုရွေးချယ်. နှစ်ဦးစလုံး clone ကိုထောက်ခံ, ဒါပေမယ့် StyleTTS2 Ultra tier ဖြစ်ပါသည် (50 credits) F5-TTS Premium tier ဖြစ်ပါသည် (25 credits) စဉ်.

StyleTTS2 24kHz မှာအရည်အသွေးမြင့် audio ကို generates. ကနေတဆင့် TextToSpeechAI သင် MP3 အဖြစ်ရလဒ်ကို download လုပ်နိုင်ပါတယ်, WAV, သို့မဟုတ် OGG, ကျွန်တော်တို့ဟာအထူးသဖြင့် StyleTTS2 အရည်အသွေးကိုနောက်ဆုံးဖိုင်ထဲမှာထိန်းသိမ်းထားသည်ဆိုလို high-quality encoding ကိုအသုံးပြု.

ဟုတ်ကဲ့။ StyleTTS2 ဘာသာစကား-နှုန်းထားပြောင်းလဲမှုများကိုထောက်ခံ, နှင့်၎င်း၏စတိုင်-လွှဲပြောင်းဒီဇိုင်းကွဲပြားခြားနားသောအညွှန်းကိန်း clip များကိုရွေးချယ်ခြင်းအားဖြင့်သင်တို့ကို prosody ပုံသဏ္ဍာန်ပေးသည်။ သင်လိုချင်တဲ့ဂီတနှင့်စိတ်ခံစားမှုနှင့်အတူအသံကိုရွေးချယ်ခြင်းက StyleTTS2 ပေးပို့ခြင်းအပေါ်သင်ကောင်းစွာထိန်းချုပ်ပေးသည်။

TextToSpeechAI အားလုံး GPU လုပ်ငန်းစဉ်ကိုကိုင်တွယ်ပြီးသင့်ရဲ့ပရီမီယံ StyleTTS2 အသံနဲ့အတူ download URL ကိုပြန်လာ.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 4-6GB
  • Credits/1000 chars 50

Try TTS စတိုင် ၂ Now

Generate your first audio free. No credit card required.

Start Free