Tortoise TTS

Ultra

သဘာဝကျကျပြောဆိုနိုင်သော အလွန်အမင်းအရည်အသွေးမြင့် စကားပြော

Very Slow အမြန်နှုန်း
Exceptional အရည်အသွေး
အင်း ကူးယူခြင်း
1 ဘာသာစကားများ

အကြောင်း Tortoise TTS

s available. Tortoise TTS is the only TTS model that uses the

အဓိကအင်္ဂါရပ်များ

အရည်အသွေး မြင့်မားတယ်

ရရှိနိုင်သော သဘာဝအသံထွက် TTS output များ

အသံဖမ်းယူခြင်း

ထူးခြားတဲ့ တိကျမှုနဲ့ အရောင်အသွေးတွေနဲ့ အသံတွေကို ကူးယူပါ။

သဘာဝ အသုံးအနှုန်း

သေးငယ်သောစကားပြောပုံစံများနှင့် micro-expressions ကို captures ။

အရည်အသွေး သတ်မှတ်ချက်

ultra_fast မှ high_quality စီမံခန့်ခွဲမှုမှရွေးချယ်ပါ။

ခံစားမှု နက်နဲမှု

အစစ်အမှန်စိတ်ခံစားမှု resonance နှင့်အတူစကားပြော generates ။

ရင်းမြစ် ဖွင့်

Apache 2.0 စီးပွားရေးလုပ်ငန်းအသုံးပြုခွင့်နှင့်အတူလိုင်စင်။

အသုံးပြုမှုအခြေအနေများ

Premium အသံစာအုပ်များ ရုပ်ရှင်ထုတ်လုပ်မှု မှတ်တမ်းရုပ်ရှင် ပြောပြချက် ပရော်ဖက်ရှင်နယ် အသံသွင်း ဖိုင်ထုပ်ပရောဂျက်များ High-End အကြောင်းအရာ

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

ဘယ်လိုအသုံးပြုရမည် Tortoise TTS

  1. 1

    မှတ်ပုံတင်သို့မဟုတ်အခမဲ့ demo ကိုစမ်းသပ်

    အခမဲ့တစ်ခုဖန်တီး TextToSpeechAI account ကို starter credits တွေကိုရဖို့, သို့မဟုတ်မှာ sign-in မပါဘဲ Tortoise စမ်းသပ်ဖို့ homepage ကို demo ကိုအသုံးပြု. Tortoise တစ်ခု Ultra-tier engine ကိုဖြစ်ပါသည် (50 credits per 1000 characters), ဒါကြောင့်အခမဲ့ credits တွေကိုပထမဦးဆုံးအတိုစမ်းသပ်မှုအတွက်အပြည့်အဝဖြစ်ကြသည်။

  2. 2

    Tortoise ကိုရွေးပြီး ကလွန်ဖို့ အသံတစ်ခုကို ထည့်သွင်းပါ

    အသံ browser မှတစ်ဦး Tortoise အသံကိုရွေးချယ်ပါ။ တိကျတဲ့လူတစ်ဦးကို clone ဖို့, ရည်ညွှန်း clip ကို upload (အချို့ကိုကောင်းစွာသန့်ရှင်း5-10 စက္ကန့်နမူနာ) နှင့် Tortoise မြင့်မားသောယုံကြည်မှုနှင့်အတူထိုအသံကိုပြန်လုပ်လိမ့်မည်။

  3. 3

    စာသားကို ထည့်ပါ

    Type or paste the text you want narrated. Tortoise သည်နှေးသောကြောင့်, အပြည့်အဝအသံစာအုပ်အခန်းသို့မဟုတ်ရှည်လျားသော script ကိုပို့မတိုင်မီအသံနှင့် tone ကိုသေချာစေရန်အတိုကောက် passage နှင့်အတူစတင်.

  4. 4

    အရည်အသွေး သတ်မှတ်ချက်ကို ရွေးပြီး ထုတ်လုပ်ပါ

    ရွေးချယ်ပါ Tortoise အရည်အသွေး preset: မြန်မြန်ဆန်ဆန်စမ်းသပ်မှုများအတွက် ultra_fast, ကောင်းသောမြန်နှုန်း / အရည်အသွေးအညီအမျှအတွက်မြန်ဆန်ဆန် (အကြံပြု default), စံ, သို့မဟုတ်အမြင့်ဆုံး realism အတွက် high_quality. ထို့နောက် click ကိုထုတ်လုပ်ခြင်းနှင့်လူနာဖြစ်ပါသည် - Tortoise မှယူနိုင်ပါတယ် 30 စက္ကန့်ကနေ clip တစ်မိနစ်လျှင်မိနစ်အနည်းငယ်, အထူးသဖြင့်အမြင့်ဆုံး presets မှာ.

  5. 5

    API ကို download လုပ်ပါ

    မျိုးဆက်ပြီးဆုံးသောအခါ, MP3 အဖြစ်သင်၏အသံကိုဒေါင်းလုပ်, WAV, သို့မဟုတ် OGG, သို့မဟုတ်သင်၏သမိုင်းမှ fetch. Tortoise အလုပ်အကိုင်များကိုအလိုအလျောက်ဖို့, TextToSpeechAI API ကိုခေါ်ဆိုခြင်းနှင့်သင်၏ရွေးချယ်ထားသောအရည်အသွေး preset ကိုကျော်လွန် - Tortoise အနှေး renders ကတည်းကပိုမိုကြာရှည် timeouts ခွင့်ပြုဖို့သတိရ.

Tortoise TTS API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ပင်လယ်ကြွက်သည် အချိန်ယူသော်လည်း အကျိုးဆက်များကို စောင့်ဆိုင်းသင့်သည်။",
    "voice": "tortoise-angie"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

Tortoise TTS ဟာ အသံအရည်အသွေးကို အထူးဂရုစိုက်တဲ့ James Betker ရဲ့ autoregressive text-to-speech model ဖြစ်ပါတယ်။ Transform-based language modeling ကို diffusion decoding နဲ့ပေါင်းစပ်ပြီး သဘာဝကျကျ စကားပြောနိုင်ဖို့အတွက် အသုံးပြုပါတယ်။

ဟုတ်ကဲ့. Tortoise TTS သည်ခွင့်ပြုချက် Apache 2.0 လိုင်စင်အောက်တွင် open-source ဖြစ်သည်, စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု, ပြုပြင်ခြင်းနှင့်ပြန်လည်ဖြန့်ဝေခြင်း။ TextToSpeechAI အပေါ်, Tortoise သည် Ultra tier တွင်ထိုင် 50 credits per 1000 characters because of its heavy compute requirements and exceptional output quality.

Tortoise သည်ဒီဇိုင်းအားဖြင့်နှေးသည်: ၎င်းသည်အချို့သောကိုယ်စားလှယ်လောင်းများ clip များကို autoregressively ထုတ်လုပ်ပြီးနောက်တစ်ဦးပျံ့နှံ့မှုမော်ဒယ်နှင့် CLVP re-ranking အဆင့်နှင့်အတူအကောင်းဆုံးတစ်ခုကိုကောင်းမွန်အောင်ပြုလုပ်သည်။ ဤအရည်အသွေး-ပထမဦးဆုံးပြွန်ဆိုလိုသည်မှာတစ်ဦးတည်း clip ကိုမှယူနိုင်သည် 30 စာသားအရှည်နှင့်အရည်အသွေး preset ကိုပေါ် မူတည်. များစွာသောမိနစ်များအတွင်းစက္ကန့်။

Tortoise offers four presets that trade speed for quality: ultra_fast (~10x faster, good for testing), fast (~4x faster, the production default), standard (balanced), and high_quality (maximum quality, slowest). Higher presets sample more candidates and run more diffusion steps before selecting the best result. On TextToSpeechAI you can pick a preset before generating.

ဟုတ်ကဲ့, Tortoise TTS ထူးခြားတဲ့ယုံကြည်စိတ်ချမှုနှင့်အတူအသံ cloning ကိုထောက်ခံ. ရည်မှန်းချက်အသံ၏အနည်းငယ်တိုတောင်း reference clip များကိုပေး (အလိုအလျောက် 3-10 5-10 စက္ကန့်တစ်ဦးချင်းစီ၏နမူနာ) နှင့် Tortoise ဟောပြောသူ၏ timbre captures, accent, pacing, နှင့်သိမ်မွေ့ micro-expressions. ဒါဟာအများဆုံးတိကျသော zero-shot cloning engines ထဲကတစ်ခုဖြစ်ပါတယ်, cloning ကတည်းက-ရှည်လျားမျိုးဆက်အချိန်ကိုပေါင်းစပ်သော်လည်း.

Tortoise သည်အဓိကအားဖြင့်အင်္ဂလိပ်စကားပြော dataset များအပေါ်လေ့ကျင့်ခဲ့သည်, ထို့ကြောင့်အင်္ဂလိပ်သည်၎င်း၏အရည်အသွေးသည်အခိုင်အမာဆုံးဖြစ်သည်. တူညီသောလက်တွေ့ကျကျလိုအပ်သောဘာသာစကားများစွာအတွက်ပရောဂျက်များအတွက်, TextToSpeechAI တွင် F5-TTS သို့မဟုတ် CosyVoice2 ကိုစဉ်းစားပါ, ၎င်းသည်ပိုမိုဘာသာစကားများကိုထောက်ပံ့ပေးပြီးအသံ clone ကိုဆက်လက်ပေးသည်။

Tortoise ထူးခြားတဲ့ထုတ်လုပ်, အချို့သောအခါ indistinguishable-from-လူသားအသံ. ဒါဟာအသက်ရှူ captures, တွန့်ဆုတ်, intonation, နှင့်အလင်းရောင်မော်ဒယ်များမေ့လျော့ကြောင်းစစ်မှန်တဲ့စိတ်ခံစားမှု resonance ကို. ဒါဟာပရီမီယံ audiobooks အတွက်အကြိုက်ဆုံးဖြစ်ရပ်တည်နေပါတယ်ဘာကြောင့်, ရုပ်ရှင်ပြောပြ, နှင့် realism အရေးပါဆုံးဖြစ်ပါတယ်နေရာမှာ high-end voiceover အလုပ်.

Tortoise အများအားဖြင့်အရည်အသွေး preset နှင့် batch အရွယ်အစားပေါ် မူတည်. VRAM ၏ 12-24GB ကိုလိုအပ်ပါတယ်, ထိုသို့ RTX ကဲ့သို့ high-end GPUs 3090, 4090, သို့မဟုတ် A100 ဒေသခံအသုံးပြုမှုအတွက်အကြံပြုထားသည်။ CPU ကိုအယူအဆနည်းပညာပိုင်းအရဖြစ်နိုင်သော်လည်းအလွန်နှေးသည်။ အပေါ် TextToSpeechAI ပုံစံကျွန်တော်တို့ရဲ့ GPU အခြေခံအဆောက်အအုံပေါ်တွင် runs, ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင်အဘယ်သူမျှမ hardware ကိုလိုအပ်.

Tortoise သဘာဝအရည်အသွေးမြင့် 24kHz WAV အသံဖိုင်ကို renders. TextToSpeechAI ကနေတဆင့်သင် MP3 ကိုတောင်းဆိုနိုင်ပါတယ်, WAV, သို့မဟုတ် OGG, ကျွန်တော်တို့ဟာအရည်အသွေး-ထိန်းသိမ်းရေး encoding နှင့်အတူ transcode ပေးသည်သင်သည်သင်၏ပရောဂျက်လိုအပ်ချက်များအတွက်မည်သည့် format ကိုမှာမော်ဒယ်၏ကောင်းမွန်သောအသေးစိတ်ကိုထိန်းသိမ်းထားဖို့။

Tortoise မှာ Ultra ဈေးနှုန်းအဆင့်မှာဖြစ်ပါသည် 50 credits per 1000 characters, ၎င်း၏အရည်အသွေး-ပထမဦးဆုံးပြွန်စားသုံးမှု GPU အချိန်ကိုထင်ဟပ်. အသစ်အကောင့်များအခမဲ့စတင် credits တွေကိုရ, သငျသညျ committing ရှေ့မှာ Tortoise ကိုစမ်းသပ်နိုင်ပါတယ်ဒါကြောင့်. အဆိုပါ Ultra tier လည်း StyleTTS2 ကိုဖုံးလွှမ်း, OpenVoice, Dia, နှင့် Zonos.

အားလုံးနှစ်ဦးစလုံး Ultra-tier engines များဖြစ်ကြသည်, ဒါပေမယ့်သူတို့ကွဲပြားခြားနားစွာကုန်သွယ်. Tortoise TTS သဘာဝကျကျနဲ့စိတ်ခံစားမှုအနက်ကို၏အပြည့်အဝအမြင့်ဆုံးကိုရောက်ရှိပေမယ့်အကွာအဝေးအားဖြင့်အနှေးဆုံးအင်ဂျင်ဖြစ်ပါသည်. StyleTTS2 အများကြီးပိုမြန်မျိုးဆက်နှင့်အတူနီးကပ်-Tortoise အရည်အသွေးကိုပေးပို့, သင်များစွာသော clip များသို့မဟုတ်ပိုမြန် turn-around လိုအပ်တဲ့အခါပိုကောင်းတဲ့ရွေးချယ်မှုဖြစ်စေ. အရည်အသွေး Non-negotiable ဖြစ်ပြီးအချိန်ကတစ်ကန့်သတ်ချက်မဟုတ်တဲ့အခါ Pick Tortoise.

ဟုတ်ကဲ့. အပေါ်မှတ်ပုံတင် TextToSpeechAI အခမဲ့ starter credits များကိုရယူရန်, သို့မဟုတ်အိမ်စာမျက်နှာပေါ်တွင် demo ကိုအသုံးပြု, နှင့်ဘာမှ install မပါဘဲတစ် clip ကိုထုတ်လုပ်ရန်တစ်ဦး Tortoise အသံကိုရွေးချယ်. Tortoise နှေးသောကြောင့်, တိုတောင်းသောဝါကျနှင့်အတူစတင်နှင့် "မြန်" preset ကိုပိုမိုကြာရှည်အလုပ်များမောင်းနှင်မတိုင်မီအရည်အသွေးကိုကြည့်ရှုရန်.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free