ကောကောရို

Standard

သဘာဝအရည်အသွေးနှင့်အတူ lightning-မြန်, အလေးချိန် TTS

Very Fast အမြန်နှုန်း
Good အရည်အသွေး
ဟုတ်တယ် ကူးယူခြင်း
9 ဘာသာစကားများ

အကြောင်း ကောကောရို

82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters. Kokoro is the first TTS model to support 82M parameters, and the first TTS model to support

အဓိကအင်္ဂါရပ်များ

အလွန်အလင်း

82M parameters, ~300MB model size. အနည်းဆုံးအရင်းအမြစ်များနှင့်အတူ CPU ကိုပေါ်တွင် Runs.

တကယ့်အချိန်

GPU မြန်နှုန်းမြှင့်ခြင်းမရှိဘဲ ဖွင့်လှစ်မှုမြန်နှုန်းထက် စကားပြောကို ပိုမြန်အောင် ထုတ်လုပ်ပါ

ဘာသာစကား များစွာ

Supports English, French, Spanish, Hindi, Japanese, Chinese, Italian, Portuguese, and Korean.

အသံပေါင်းစပ်ခြင်း

ထူးခြားသော အသံပေါင်းစပ်မှုတစ်ခု ဖန်တီးရန် အသံနှစ်ခုကို ပေါင်းစပ်ပါ

အသုံးပြုမှုအခြေအနေများ

အစစ်အမှန်အချိန် chatbots နှင့် virtual assistants ချက်ချင်းစာသားမှစကားပြောရန် Edge ဖြန့်ချိခြင်းနှင့်မိုဘိုင်း application များ မြင့်မားသော-အရွယ်အစား batch စီမံခန့်ခွဲမှု

ဘယ်လိုအသုံးပြုရမည် ကောကောရို

  1. 1

    အခမဲ့မှတ်ပုံတင်သို့မဟုတ် demo ကိုစမ်းသပ်

    200 starter credits တွေကိုရဖို့အခမဲ့ TextToSpeechAI အကောင့်တစ်ခုဖန်တီး, သို့မဟုတ် Kokoro ချက်ချင်းနားထောင်ဖို့မရှိ-signup demo ကိုအသုံးပြု. စံအဆင့် Kokoro ပဲကုန်ကျစရိတ် 10 credits per 1000 characters.

  2. 2

    Kokoro အသံကို ရွေးပါ

    Voice browser ကိုဖွင့်လှစ်ပြီးသင်၏ရည်မှန်းချက်ဘာသာစကားတွင် Kokoro အသံကိုရွေးချယ်ပါ (9 ထောက်ခံ, ဂျပန်နှင့်ကိုရီးယားမှအင်္ဂလိပ်မှ). သင်သည်လည်း Kokoro အသံရောနှောသုံးပြီး custom combination တစ်ခုသို့နှစ်ခုအသံများရောနှောနိုင်ပါတယ်.

  3. 3

    စာသားကို ထည့်ပါ

    Kokoro ၏အလေးချိန် 82M-parameter ကိုကျေးဇူးတင်ကောင်းစွာ, real-time engine ကိုနီးကပ်စွာရှည်လျားသော passages များထိရောက်စွာကိုင်တွယ်.

  4. 4

    အမြန်နှုန်းကို ချိန်ညှိပြီး ထုတ်လုပ်ပါ

    Kokoro ဟာ real-time ထက် အသံကို ပိုမြန်မြန် ထုတ်လုပ်ပေးနိုင်တာကြောင့် သင့်ရဲ့ စကားပြောသံဟာ ချက်ချင်းပဲ ထွက်လာမှာပါ။

  5. 5

    API ကို download လုပ်ပါ

    MP3 သို့မဟုတ် WAV အဖြစ်ပြီးစီးအသံကိုဒေါင်းလုပ်, သို့မဟုတ် batch နှင့်လက်တွေ့အချိန်အလုပ်အကိုင်များအဘို့အ api.texttospeechai.com မှာ TextToSpeechAI REST API ကိုမှတဆင့်အလိုအလျောက်မျိုးဆက်.

ကောကောရို API

TextToSpeechAI REST API ကိုအသုံးပြုပြီးစကားပြော programming အားဖြင့် generate ။

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro သည် မယုံနိုင်လောက်အောင် အမြန်နှုန်းနှင့် ထိရောက်မှုဖြင့် သဘာဝကျသော စကားပြောဆိုမှုကို ပေးစွမ်းသည်။",
    "voice": "en_US-lessac-medium"
  }'

မေးလေ့ရှိသောမေးခွန်းများ

Kokoro သည် 82 ဘီလီယံ parameters များသာပါရှိသော ultra-lightweight text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်း၏သေးငယ်သောအရွယ်အစားကိုပင်ဖြစ်စေ၊ CPU ပေါ်တွင်ပင်ဖြစ်စေ၊ ဘာသာစကားများစွာအကြားတွင် အနီးဆုံး real-time speed ဖြင့် သဘာဝကျကျ ထွက်ပေါ်လာသော စကားသံကို ထုတ်လုပ်ပေးသည်။

ဟုတ်ကဲ့, Kokoro လုံးဝ Apache 2.0 လိုင်စင်ဖြစ်ပါသည် - code ကိုနှင့်မော်ဒယ်အလေးချိန်နှစ်ခုစလုံး။ ဒါဟာကန့်သတ်ချက်မရှိဘဲစီးပွားရေးလုပ်ငန်း applications များမှာအခမဲ့အသုံးပြုနိုင်သည်။

Kokoro အင်္ဂလိပ် (အမေရိကန်နှင့်ဘရစ်တန်), ပြင်သစ်, စပိန်, ဟိန္ဒူ, ဂျပန်, တရုတ်, အီတလီ, ပေါ်တူဂီနှင့်ကော်ရစ်ကန်ထောက်ခံ.

Kokoro သည်ရရှိနိုင်သောအမြန်ဆုံး TTS ပုံစံများထဲမှတစ်ခုဖြစ်သည်။ ၎င်းသည် CPU တွင်ပင်အမှန်တကယ်အချိန် playback မြန်နှုန်းထက်ပိုမိုမြန်ဆန်စွာစကားပြောနိုင်ပြီးအပြန်အလှန်ဆက်သွယ်မှုများအတွက်အလွန်သင့်လျော်သည်။

Kokoro သည် အသံဖမ်းယူခြင်းကို မထောက်ပံ့ပါ။ အသံပေါင်းစပ်နိုင်စွမ်းရှိသော ထိန်းသိမ်းထားသော အသံဖမ်းယူခြင်း စာအုပ်တိုက်ကို အသုံးပြုသည်။ အသံဖမ်းယူခြင်းအတွက် F5-TTS, Chatterbox, StyleTTS2, OpenVoice, or Tortoise ကို အသုံးပြုပါ။

Kokoro ဟာ ထူးခြားတဲ့ ပေါင်းစပ်မှုတွေကို ဖန်တီးဖို့ အသံနှစ်ခုကို ပေါင်းစပ်နိုင်တယ်။ ဒါကြောင့် ရိုးရာ အသံဖန်တီးမှု မရှိဘဲ ကိုယ်ပိုင် အသံအရည်အသွေးတွေကို ဖန်တီးနိုင်တယ်။

Kokoro ဟာ ပိုမို ခေတ်မီတဲ့ တည်ဆောက်ပုံနဲ့ အသံပေါင်းစပ်မှု ထောက်ပံ့ပေးနိုင်ပြီး Piper ဟာ အကြီးမားဆုံး အသံ library တစ်ခု ပိုင်ဆိုင်ထားပါတယ်။

Kokoro CPU ကိုပေါ်တွင် run ရန်ဒီဇိုင်းရေးဆွဲထားပြီးအနည်းဆုံးအရင်းအမြစ်လိုအပ်သည် - 300MB ဝန်းကျင်. GPU ကို acceleration ထက်ပိုမိုမြန်ဆန် processing အတွက်ထောက်ခံသော်လည်း, GPU ကိုလိုအပ်သည်မဟုတ်။

ဟုတ်ကဲ့. Kokoro CPU ကိုအပေါ်ပင် playback ထက်စကားပြောပိုမိုမြန်ဆန် generates, အလွန်အနည်းငယ် latency နှင့်အတူ, ဒါကြောင့် chatbots အတွက်အလွန်ကောင်းမွန်တဲ့ fit ဖြစ်ပါတယ်, အသံအကူ, နှင့်တိုက်ရိုက် streaming ကို. ၎င်း၏ 82M-parameter အရွယ်အစားမှတ်ဉာဏ်အသုံးပြုမှုသေးငယ်တဲ့ထိန်းသိမ်းထား, high-volume နှင့် Edge တပ်ဆင်မှုများအတွက်လက်တွေ့ဖြစ်စေ.

Voice blending ဟာ သင့်ကို Kokoro voices နှစ်ခုကို ပေါင်းစပ်ပြီး ထူးခြားတဲ့ combination တစ်ခုကို ဖန်တီးပေးပါတယ်။ ဒါဟာ အစဉ်အလာ voice clone မဟုတ်ပါဘူး။ ဥပမာအားဖြင့် တိကျတဲ့ လူတစ်ယောက်ကို ပြန်လည်ထုတ်လုပ်လို့ မရနိုင်ပါဘူး။ ဒါပေမဲ့ ခိုင်မာတဲ့ voice library ထက် ပိုပြီး မျိုးစုံတဲ့ ပုံစံမျိုးကို ပေးပါတယ်။ TextToSpeechAI editor ထဲမှာ ရောနှောမှုတွေကို တိုက်ရိုက် စမ်းသပ်နိုင်တယ်။

Kokoro သည်အလင်းဆုံးဖြစ်သည် (300MB အကြောင်း) နှင့်9ဘာသာစကားများအကြားအသံရောနှောထောက်ခံ, MeloTTS အများအပြားအင်္ဂလိပ် accents နှင့် real-time multilingual output ကိုအာရုံစိုက်နေစဉ်. Kokoro ကိုရွေးချယ်ပါအသေးဆုံးခြေရာနှင့်ရောနှောအတွက်; သင်အတိအကျ accents လိုအပ်တဲ့အခါ MeloTTS ကိုရွေးချယ်ပါ.

Kokoro 10 credits per 1000 characters - TextToSpeechAI အပေါ်အနည်းဆုံး tier ကုန်ကျစရိတ် 10 စံ-tier engine ကိုဖြစ်ပါသည်. အသစ်အကောင့်များရ 200 အခမဲ့ credits, ဒါကြောင့်သင်ပေးဆောင်ခြင်းမရှိဘဲ Kokoro ကိုစမ်းသပ်နိုင်ပါတယ်. ဒါဟာအရွယ်အစားမှာအရည်အသွေးမြင့်စကားပြောထုတ်လုပ်ရန်အလွန်ကုန်ကျစရိတ်သက်သာနည်းလမ်းများထဲကတစ်ခုဖြစ်စေသည်။

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try ကောကောရို Now

Generate your first audio free. No credit card required.

Start Free