កូកូរ៉ូ​world. kgm

Standard

ឆាប់​រហ័ស​ខ្លាំង TTS ធន់​ស្រាល​ជាមួយ​គុណភាព​ធម្មជាតិ

Very Fast ល្បឿន​
Good គុណភាព
គ្មាន ក្លូន
9 ភាសា

អំពី កូកូរ៉ូ​world. kgm

82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters in the world. Kokoro is the first TTS model to support 82M parameters in the world.

លក្ខណៈ​ពិសេស​សំខាន់

ធន់​ខ្លាំង​បំផុត

ប៉ារ៉ាម៉ែត្រ 82M, ~300MB ទំហំម៉ូដែល ។ រត់លើស៊ីភីយូជាមួយធនធានតិចតួច ។

ពេល​វេលា​ពិត​

បង្កើត​ការ​និយាយ​លឿន​ជាង​ល្បឿន​ចាក់ ទោះ​បី​គ្មាន​ការ​បង្កើន​ល្បឿន GPU ក៏ដោយ & # 160; ។

ភាសា​ច្រើន

គាំទ្រ ភាសា អង់គ្លេស, បារាំង, អេស្ប៉ាញ, ឥណ្ឌា, ជប៉ុន, ចិន, អ៊ីតាលី, ព័រទុយហ្គាល់ និង ភាសា កូរ៉េ.

ការ​លាយ​សំឡេង

លាយ​សំឡេង​ពីរ​ជាមួយ​គ្នា​ដើម្បី​បង្កើត​ការ​ផ្សំ​សំឡេង​ដែល​មាន​តែ​មួយ​គត់ & # 160; ។

ករណី​ប្រើ

chatbots ពេលវេលា​ពិត និង​អ្នក​ជំនួយការ​និម្មិត អត្ថបទ​ទៅ​ការ​និយាយ​ស្ទ្រីម​ផ្ទាល់ ការ​បែងចែក​ចំណុច​ប្រទាក់ និង​កម្មវិធី​ចល័ត ការ​ដំណើរការ​បាច់​កម្រិត​ខ្ពស់

របៀប​ប្រើ កូកូរ៉ូ​world. kgm

  1. 1

    ចុះឈ្មោះដោយឥតគិតថ្លៃឬព្យាយាមបង្ហាញ

    បង្កើតគណនីឥតគិតថ្លៃ TextToSpeechAI ដើម្បីទទួលបាន 200 គ្រីបចាប់ផ្តើមឬប្រើការបង្ហាញមិនចុះឈ្មោះដើម្បីស្តាប់ Kokoro ភ្លាមៗ។ កម្រិតស្តង់ដារមានន័យថា Kokoro ចំណាយតែ 10 គ្រីបក្នុងមួយ 1000 តួអក្សរ។

  2. 2

    ជ្រើស​សំឡេង Kokoro

    បើក​កម្មវិធី​រុករក​សំឡេង ហើយ​ជ្រើស​សំឡេង Kokoro ក្នុង​ភាសា​គោលដៅ​របស់​អ្នក (9 គាំទ្រ​ពី​ភាសា​អង់គ្លេស​ទៅ​ជា​ភាសា​ជប៉ុន និង​កូរ៉េ) & # 160; ។ អ្នក​ក៏​អាច​ប្រើ​ការ​លាយ​សំឡេង Kokoro ដើម្បី​លាយ​សំឡេង​ពីរ​ចូល​ក្នុង​ការ​ផ្សំ​ផ្ទាល់ខ្លួន & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក

    វាយ ឬ​បិទភ្ជាប់​អត្ថបទ​ដែល​អ្នក​ចង់​និយាយ​ចូល​ក្នុង​កម្មវិធី​និពន្ធ & # 160; ។ Kokoro គ្រប់គ្រង​អត្ថបទ​វែង​ដោយ​មាន​ប្រសិទ្ធភាព​ដោយ​សារ​ប៉ារ៉ាម៉ែត្រ 82M ស្រាល​របស់​វា ម៉ាស៊ីន​ពេល​វេលា​ពិត & # 160; ។

  4. 4

    លៃតម្រូវ​ល្បឿន និង​បង្កើត

    កំណត់​ល្បឿន​ចាក់​ដើម្បី​សម​នឹង​ករណី​ប្រើ​របស់​អ្នក បន្ទាប់​មក​ចុច បង្កើត & # 160; ។ Kokoro បង្ហាញ​អូឌីយ៉ូ​លឿន​ជាង​ពេល​ពិត ដូច្នេះ​ការ​និយាយ​របស់​អ្នក​គឺ​រួចរាល់​ស្ទើរ​តែ​ភ្លាមៗ & # 160; ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    ទាញយកអូឌីយ៉ូដែលបានបញ្ចប់ជា MP3 ឬ WAV ឬបង្កើតដោយស្វ័យប្រវត្តិតាមរយៈ TextToSpeechAI REST API នៅ api.texttospeechai.com សម្រាប់បន្ទុកការងារបាច់និងពេលវេលាពិតប្រាកដ។

កូកូរ៉ូ​world. kgm API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro ផ្ដល់​ការ​និយាយ​ធម្មជាតិ​ជាមួយ​ល្បឿន​មិន​គួរ​ឲ្យ​ជឿ និង​ប្រសិទ្ធភាព ។",
    "voice": "en_US-lessac-medium"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

Kokoro គឺ​ជា​គំរូ​អត្ថបទ​ទៅ​ជា​ការ​និយាយ​ដែល​មាន​ទម្ងន់​ស្រាល​បំផុត​ដែល​មាន​ប៉ារ៉ាម៉ែត្រ​តែ ៨២ លាន​ប៉ុណ្ណោះ ។ ទោះ​បី​ជា​ទំហំ​តូច​របស់​វា​ក៏ដោយ វា​ផលិត​ការ​និយាយ​ដែល​មាន​សំឡេង​ធម្មជាតិ​តាម​រយៈ​ភាសា​ច្រើន​នៅ​ល្បឿន​ពេល​ពិត​ជិត​បំផុត ទោះ​បី​នៅ​លើ​ស៊ីភីយូ​ក៏​ដោយ ។

បាទ Kokoro គឺ​ជា​អាជ្ញាប័ណ្ណ Apache 2.0 ទាំងស្រុង - ទាំង​កូដ និង​ទំងន់​ម៉ូដែល ។ វា​អាច​ត្រូវ​បាន​ប្រើ​ដោយ​សេរី​ក្នុង​កម្មវិធី​ពាណិជ្ជកម្ម​ដោយ​គ្មាន​ការ​កំណត់ ។

Kokoro គាំទ្រ​ភាសា​អង់គ្លេស (អាមេរិក និង​អង់គ្លេស) បារាំង អេស្ប៉ាញ ឥណ្ឌា ជប៉ុន ចិន អ៊ីតាលី ព័រទុយហ្គាល់ និង​កូរ៉េ ។

Kokoro គឺ​ជា​ម៉ូដែល TTS មួយ​ក្នុង​ចំណោម​ម៉ូដែល​ដែល​មាន​ល្បឿន​លឿន​បំផុត & # 160; ។ វា​បង្កើត​ការ​និយាយ​លឿន​ជាង​ល្បឿន​ចាក់​ពេល​ពិត​នៅ​លើ​ស៊ីភីយូ ធ្វើ​ឲ្យ​វា​ល្អ​សម្រាប់​កម្មវិធី​អន្តរកម្ម & # 160; ។

ទេ Kokoro មិន​គាំទ្រ​ការ​ក្លូន​សំឡេង​ទេ & # 160; ។ វា​ប្រើ​បណ្ណាល័យ​សំឡេង​ដែល​បាន​រៀបចំ​ជាមួយ​សមត្ថភាព​លាយ​សំឡេង & # 160; ។ សម្រាប់​ក្លូន​សំឡេង ប្រើ F5- TTS Chatterbox StyleTTS2 OpenVoice ឬ Tortoise & # 160; ។

Kokoro អាច​លាយ​សំឡេង​ពីរ​ជាមួយ​គ្នា​ដើម្បី​បង្កើត​ការ​ផ្សំ​តែ​មួយ​គត់ & # 160; ។ វា​អនុញ្ញាត​ឲ្យ​អ្នក​បង្កើត​លក្ខណៈ​ពិសេស​សំឡេង​ផ្ទាល់ខ្លួន​ដោយ​គ្មាន​ការ​ក្លូន​សំឡេង​បែប​បុរាណ & # 160; ។

ទាំង​ពីរ​គឺ​លឿន ម៉ូដែល​ស្រាល & # 160; ។ Kokoro មាន​ស្ថាបត្យកម្ម​ទាន់សម័យ​ជាង និង​គាំទ្រ​ការ​លាយ​សំឡេង ខណៈ​ពេល Piper មាន​បណ្ណាល័យ​សំឡេង​ធំ & # 160; ។ ទាំង​ពីរ​គឺ​ល្អ​សម្រាប់​កម្មវិធី​ពេល​ពិត & # 160; ។

Kokoro ត្រូវ​បាន​រចនា​ដើម្បី​រត់​លើ​ស៊ីភីយូ ហើយ​ទាមទារ​ធនធាន​តិចតួច - ប្រហែល 300MB ។ គ្មាន GPU ត្រូវ​បាន​ត្រូវការ ទោះ​បី​ជា​ការ​បង្កើន​ល្បឿន GPU ត្រូវ​បាន​គាំទ្រ​សម្រាប់​ដំណើរការ​លឿន​ជាង​នេះ​ក៏​ដោយ ។

មែន. Kokoro បង្កើតការនិយាយលឿនជាងការចាក់សូម្បីតែនៅលើ CPU, ជាមួយនឹងការពន្យារពេលទាបណាស់, ដូច្នេះវាជាការសមរម្យល្អសម្រាប់ chatbots, អ្នកជំនួយការសំឡេង, និងស្ទ្រីមផ្ទាល់. ទំហំប៉ារ៉ាម៉ែត្រ 82M របស់វារក្សាការប្រើសតិតូច, ធ្វើឱ្យវាជាក់ស្តែងសម្រាប់កម្រិតខ្ពស់និងការបញ្ជូន Edge.

Voice blending lets you mix two Kokoro voices together to create a unique combination with custom characteristics. It is not traditional voice cloning - you cannot reproduce a specific person from a sample - but it gives you more variety than a fixed voice library. You can experiment with blends directly in the TextToSpeechAI editor.

ទាំង​ពីរ​គឺ​លឿន CPU- ម៉ាស៊ីន​ដែល​មាន​លក្ខណៈ​ល្អ​ឥតខ្ចោះ​ស្តង់ដារ​កម្រិត​ដោយ​គ្មាន​ការ​ក្លូន​សំឡេង & # 160; ។ Kokoro គឺ​ស្រាល​បំផុត (ប្រហែល 300MB) និង​គាំទ្រ​ការ​លាយ​សំឡេង​តាម​រយៈ​ភាសា ៩ ខណៈ​ពេល MeloTTS ផ្តោត​លើ​សំឡេង​អង់គ្លេស​ច្រើន និង​លទ្ធផល​ភាសា​ច្រើន​ពេល​ពិត & # 160; ។ ជ្រើស Kokoro សម្រាប់​ការ​លាយ​និង​ការ​លាយ​តូច​បំផុត ជ្រើស MeloTTS ពេល​អ្នក​ត្រូវការ​សំឡេង​ជាក់លាក់ & # 160; ។

Kokoro គឺជាម៉ាស៊ីនស្តង់ដារកម្រិតមួយ, ចំណាយ 10 ឥណទានក្នុងមួយ 1000 តួអក្សរ - កម្រិតទាបបំផុតនៅលើ TextToSpeechAI. គណនីថ្មីទទួលបាន 200 ឥណទានឥតគិតថ្លៃ, ដូច្នេះអ្នកអាចព្យាយាម Kokoro ដោយមិនបង់ប្រាក់. នេះធ្វើឱ្យវាជាវិធីមួយនៃវិធីដែលមានតម្លៃថោកបំផុតដើម្បីបង្កើតការនិយាយដែលមានគុណភាពខ្ពស់នៅកម្រិត.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try កូកូរ៉ូ​world. kgm Now

Generate your first audio free. No credit card required.

Start Free