කොකෝරො

Standard

අකුණු-ඉක්මන්, ස්වාභාවික ගුණාත්මක සැහැල්ලු TTS

Very Fast වේගය
Good ගුණාත්මකභාවය
නෑ ක්ලෝන කිරීම
9 භාෂා

ගැන කොකෝරො

82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters. Kokoro is the first TTS model to support 82M parameters, and the first TTS model to support

ප්රධාන විශේෂාංග

අති- සැහැල්ලු

82M පරාමිති, ~ 300MB ආකෘති ප්‍රමාණය. අවම සම්පත් සමග CPU මත ධාවනය.

සැබෑ කාලයට ආසන්න

වාදනය වේගය වඩා වේගවත් කතාබහ ජනනය, GPU ත්වරණය නොමැතිව පවා.

බහු භාෂා

ඉංග්රීසි, ප්රංශ, ස්පාඤ්ඤ, හින්දි, ජපන්, චීන, ඉතාලි, පෘතුගීසි, සහ කොරියානු සහාය.

හඬ මිශ්‍ර කිරීම

2.අනුරූප ව්‍යුහයක් නිර්මාණය කිරීම සඳහා ව්‍යුහ දෙකක් එකට සම්බන්ධ කිරීම.

භාවිතය

සැබෑ-කාලය චැට්බෝට් සහ අතථ්ය සහායකයින් සජීවීව ධාවනය වන පෙළ-කතා කිරීම Edge ස්ථාපනය සහ ජංගම යෙදුම් ඉහළ පරිමාව බැච් සැකසීම

භාවිතා කරන ආකාරය කොකෝරො

  1. 1

    නොමිලේ ලියාපදිංචි වන්න හෝ දර්ශනය උත්සාහ කරන්න

    200 ආරම්භක ණය ලබා ගැනීමට නොමිලේ TextToSpeechAI ගිණුමක් නිර්මාණය කරන්න, හෝ Kokoro ඉක්මනින් ඇසීමට නො-සහභාගී ඩෙමෝ භාවිතා කරන්න. සම්මත ස්ථරය Kokoro පමණක් වියදම් 10 1000 අක්ෂර සඳහා ණය අදහස්.

  2. 2

    Kokoro හඬක් තෝරන්න

    හඬ බ්රවුසරය විවෘත සහ ඔබේ ඉලක්ක භාෂාව Kokoro හඬ තෝරා (9 සහාය, ජපන් හා කොරියානු ඉංග්රීසි සිට). ඔබ ද අභිරුචි සංයෝජනයක් බවට හඬ දෙකක් මිශ්ර කිරීමට Kokoro හඬ මිශ්ර භාවිතා කළ හැකිය.

  3. 3

    ඔබේ පෙළ ඇතුළත් කරන්න

    ඔබ සංස්කාරකවරයාට කතා කිරීමට අවශ්ය පෙළ වර්ග හෝ ඇලවීම. Kokoro එහි සැහැල්ලු 82M-පරාමිතීන් ස්තුති කාර්යක්ෂමව දිගු වාක්‍ය හැසිරවීම, ළඟ තත්ත්ව-කාල එන්ජිම.

  4. 4

    වේගය සකසන්න සහ ජනනය කරන්න

    ඔබේ භාවිතය නඩුව ගැලපෙන වාදනය වේගය සකස්, ඉන්පසු ජනනය ක්ලික් කරන්න. Kokoro සැබෑ-කාලය වඩා වේගවත් ශබ්ද රඟ දක්වයි, ඒ නිසා ඔබේ කථාව සූදානම් වහාම.

  5. 5

    API බාගත හෝ භාවිතා කරන්න

    MP3 හෝ WAV ලෙස අවසන් ශ්රව්ය බාගත, හෝ කණ්ඩායම් හා සැබෑ-කාලීන වැඩ බර සඳහා api.texttospeechai.com දී TextToSpeechAI REST API හරහා ජනගහනය ස්වයංක්රීය.

කොකෝරො API

TextToSpeechAI REST API භාවිතා කරමින් වැඩසටහන්ගතව කථාව ජනනය කරන්න.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ක්වොන්ටම් භෞතිකය යනු විද්‍යුත් චුම්භකත්වය හා විද්‍යුත් චුම්භකත්වය අතර ඇති සම්බන්ධතාවයයි.",
    "voice": "en_US-lessac-medium"
  }'

නිතර අසන ප්රශ්න

Kokoro යනු 82 මිලියන පරාමිති පමණක් ඇති අතිශය සැහැල්ලු පෙළ-කථාව ආකෘතියකි. එහි කුඩා ප්රමාණයෙන් පසුව, එය සි.පී.යු. මත පවා, සැබෑ කාලයේ වේගයෙන් බහු භාෂා හරහා ස්වභාවික ශබ්ද කෝෂයක් නිපදවයි.

ඔව්, Kokoro සම්පූර්ණයෙන්ම Apache 2.0 බලපත්ර - කේතය සහ ආකෘති බර දෙකම. එය කිසිදු සීමාවන් සමග වාණිජ යෙදුම් නිදහස් භාවිතා කළ හැකිය.

කොකෝරෝ ඉංග්‍රීසි (ඇමරිකානු සහ බ්‍රිතාන්‍ය), ප්‍රංශ, ස්පාඤ්ඤ, හින්දි, ජපන්, චීන, ඉතාලි, පෘතුගීසි සහ කොරියානු සහාය දක්වයි.

Kokoro ලබා ගත හැකි වේගවත්ම TTS ආකෘති වලින් එකක්. එය CPU මත පවා සැබෑ කාලයේ ප් රචාරක වේගයකට වඩා වේගයෙන් කථාව ජනනය කරයි, අන්තර්ක් රියාකාරී යෙදුම් සඳහා එය පරිපූර්ණ කරයි.

නෑ, Kokoro හඬ ක්ලෝන සහාය නොදක්වයි. එය හඬ මිශ්ර හැකියාවන් සමග පාලනය හඬ පුස්තකාලයක් භාවිතා කරයි. හඬ ක්ලෝන සඳහා, F5-TTS, Chatterbox, StyleTTS2, OpenVoice, හෝ Tortoise භාවිතා කරන්න.

Kokoro අනර්ඝ සංයෝජන නිර්මාණය කිරීමට එකට හඬ දෙකක් මිශ්ර කළ හැක. මෙම ඔබ සාම්ප්රදායික හඬ ක්ලෝන කිරීම තොරව අභිරුචි හඬ ලක්ෂණ නිර්මාණය කිරීමට ඉඩ ලබා දෙයි.

දෙකම වේගවත්, සැහැල්ලු ආකෘති වේ. Kokoro වඩා නවීන ගෘහ නිර්මාණ ශිල්පය සහ හඬ මිශ්රණය සහාය ඇති අතර, Piper විශාල හඬ පුස්තකාලයක් ඇති අතර. දෙකම සැබෑ-කාල යෙදුම් සඳහා විශිෂ්ට වේ.

CPU මත ධාවනය කිරීමට කොකෝරෝ නිර්මාණය කර ඇති අතර අවම සම්පත් අවශ් ය වේ - 300MB පමණ. GPU අවශ් ය නොවේ, නමුත් GPU ත්වරණය වේගවත් සැකසුම් සඳහා සහාය දක්වයි.

ඔව්. Kokoro CPU මත පවා ප් රචාරණයට වඩා වේගයෙන් කතා කරයි, ඉතා අඩු ප් රමාදයකින්, එබැවින් එය චැට්බෝට්, හඬ සහායකයින් සහ සජීවී ප් රචාරණය සඳහා විශිෂ්ට ගැලපීමක්. එහි 82M-පරාමිතික ප් රමාණය මතක භාවිතය කුඩාව තබා ගනී, එය ඉහළ පරිමාණ සහ අගුළු යෙදවුම් සඳහා ප් රායෝගික කරයි.

හඬ මිශ්ර කිරීම ඔබට අභිරුචි ලක්ෂණ සමග අද්විතීය සංයෝජනයක් නිර්මාණය කිරීමට Kokoro හඬ දෙකක් එකට මිශ්ර කිරීමට ඉඩ දෙයි. එය සාම්පලයක් සිට නිශ්චිත පුද්ගලයෙකු ප්රතිනිර්මාණය කළ නොහැකි - එය සාම්ප්රදායික හඬ ක්ලෝන කිරීම නොවේ - නමුත් එය ස්ථාවර හඬ පුස්තකාලයක් වඩා වැඩි විවිධත්වයක් ලබා දෙයි. ඔබ TextToSpeechAI සංස්කාරකයේ සෘජුවම මිශ්ර සමඟ අත්හදා බැලිය හැකිය.

දෙකම වේගවත්, හඬ ක්ලෝන කිරීමකින් තොරව CPU-හිතකාමී සම්මත-තලය එන්ජින් වේ. Kokoro සැහැල්ලු (300MB ගැන) වන අතර9භාෂා හරහා හඬ මිශ්රණය සහාය, MeloTTS බහු ඉංග්රීසි උච්චාරණය හා සැබෑ-කාල බහුභාෂා ප් රතිදානය කෙරෙහි අවධානය යොමු කරන අතර. කුඩාම අඩිපාර සහ මිශ්රණය සඳහා Kokoro තෝරන්න; ඔබ විශේෂ උච්චාරණය අවශ්ය විට MeloTTS තෝරන්න.

Kokoro සම්මත-පන්තියේ එන්ජිමක් වන අතර, 10 1000 අක්ෂරයකට 10 ණය මුදලක් වැය වේ - TextToSpeechAI හි අඩුම ස්ථරය. නව ගිණුම් 200 නොමිලේ ණය ලබා ගන්නා අතර, ඔබ ගෙවීමෙන් තොරව Kokoro උත්සාහ කළ හැකිය. මෙම පරිමාණයෙන් උසස් තත්ත්වයේ කථාව ජනනය කිරීම සඳහා වඩාත් පිරිවැය ඵලදායී ක්රමයක් බවට පත් කරයි.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try කොකෝරො Now

Generate your first audio free. No credit card required.

Start Free