ឆ្កែ​ឆ្កួត TTS

Ultra

គុណភាព​ខ្ពស់​បំផុត​នៃ​ការ​និយាយ​ជាមួយ​នឹង​ភាព​ធម្មជាតិ​ដែល​មិន​អាច​ប្រៀប​ធៀប​បាន

Very Slow ល្បឿន​
Exceptional គុណភាព
បាទ/ ចាស ក្លូន
1 ភាសា

អំពី ឆ្កែ​ឆ្កួត TTS

s available. Tortoise TTS is the only TTS model that uses the

លក្ខណៈ​ពិសេស​សំខាន់

គុណភាព​ខ្ពស់​បំផុត

លទ្ធផល TTS ដែល​មាន​សំឡេង​ធម្មជាតិ​បំផុត & # 160; ។

ការ​ក្លូន​សំឡេង

ក្លូន​សំឡេង​ដោយ​ភាព​ត្រឹមត្រូវ និង​ពណ៌​លាំៗ​ពិសេស ។

វណ្ណយុត្ត​ធម្មជាតិ

ចាប់យក​លំនាំ​និយាយ​តូច​និង​កន្សោម​តូច & # 160; ។

ការ​កំណត់​គុណភាព​ជាមុន

ជ្រើស​ពី​ការ​ដំណើរការ​លឿន​បំផុត​ទៅ​ដំណើរការ​គុណភាព​ខ្ពស់ & # 160; ។

ជម្រៅ​អារម្មណ៍

បង្កើត​ការ​និយាយ​ដែល​មាន​អារម្មណ៍​ពិត​ប្រាកដ & # 160; ។

ប្រភព​បើកចំហ

Apache ២. ០ អាជ្ញាប័ណ្ណ​ជាមួយ​នឹង​សិទ្ធិ​ប្រើ​ពាណិជ្ជកម្ម & # 160; ។

ករណី​ប្រើ

សៀវភៅ​អូឌីយ៉ូ​ខ្ពស់ ការ​ផលិត​ភាពយន្ត ការ​និយាយ​ឯកសារ និយាយ​ជា​វិជ្ជាជីវៈ គម្រោង​ប័ណ្ណសារ មាតិកា​កម្រិត​ខ្ពស់

ឆ្កែ​ឆ្កួត TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

របៀប​ប្រើ ឆ្កែ​ឆ្កួត TTS

  1. 1

    ចុះឈ្មោះ ឬ សាកល្បង​ការ​បង្ហាញ​ដោយ​ឥត​គិត​ថ្លៃ

    បង្កើតដោយឥតគិតថ្លៃ TextToSpeechAI គណនីដើម្បីទទួលបានប្រាក់រង្វាន់ចាប់ផ្តើម, ឬប្រើទំព័រដើមបង្ហាញដើម្បីព្យាយាម Tortoise ដោយគ្មានការចុះឈ្មោះក្នុង. Tortoise គឺជាម៉ាស៊ីនកម្រិតខ្ពស់ (50 ប្រាក់រង្វាន់ក្នុងមួយ 1000 តួអក្សរ), ដូច្នេះឥណទានឥតគិតថ្លៃគឺល្អឥតខ្ចោះសម្រាប់ការធ្វើតេស្តខ្លីដំបូង.

  2. 2

    ជ្រើស Tortoise និង​បន្ថែម​សំឡេង​ដែល​អាច​ប្រើ​បាន​ដើម្បី​ក្លូន

    ជ្រើស​សំឡេង Tortoise ពី​កម្មវិធី​រុករក​សំឡេង & # 160; ។ ដើម្បី​ក្លូន​មនុស្ស​ជាក់លាក់ ផ្ទុក​ឡើង​នូវ​វីដេអូ​យោង (ល្អ​បំផុត​គឺ​មាន​គំរូ​ស្អាត​ចំនួន ៥- ១០ វិនាទី) ហើយ Tortoise នឹង​បង្កើត​សំឡេង​នោះ​ឡើង​វិញ​ដោយ​ភាព​ត្រឹមត្រូវ​ខ្ពស់ & # 160; ។ បើ​មិន​ដូច្នោះ​ទេ ជ្រើស​សំឡេង Tortoise មួយ​ក្នុង​ចំណោម​សំឡេង​ដែល​បាន​បង្កប់ & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក

    វាយ ឬ​បិទភ្ជាប់​អត្ថបទ​ដែល​អ្នក​ចង់​និយាយ & # 160; ។ ពីព្រោះ Tortoise គឺ​យឺត ចាប់ផ្ដើម​ជាមួយ​នឹង​ចម្លើយ​ខ្លី​ដើម្បី​បញ្ជាក់​សំឡេង និង​សំឡេង​មុន​ពេល​ផ្ញើ​ជំពូក​សៀវភៅ​អូឌីយ៉ូ​ពេញលេញ ឬ​ស្គ្រីប​វែង & # 160; ។

  4. 4

    ជ្រើស​គុណភាព​ដែល​បាន​កំណត់​ជាមុន និង​បង្កើត

    ជ្រើស​ការ​កំណត់​គុណភាព​របស់​ Tortoise មុន & # 160; ៖ ultra_ fast សម្រាប់​ការ​សាកល្បង​រហ័ស រហ័ស​សម្រាប់​ភាព​ធន់​នៃ​ល្បឿន/ គុណភាព​ល្អ (លំនាំដើម​ដែល​បាន​ផ្ដល់​អនុសាសន៍) ស្តង់ដារ ឬ high_ quality សម្រាប់​ភាព​ពិត​អតិបរមា & # 160; ។ បន្ទាប់​មក​ចុច បង្កើត និង​អត់ធ្មត់ - Tortoise អាច​ចំណាយ​ពេល​ពី ៣០ វិនាទី​ទៅ​នាទី​ជាច្រើន​ក្នុង​មួយ​ចន្លោះ​ពិសេស​នៅ​ការ​កំណត់​ជាមុន​ខ្ពស់ & # 160; ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    ពេល​បង្កើត​ចប់​ហើយ​ ទាញ​យក​អូឌីយ៉ូ​របស់​អ្នក​ជា MP3 WAV ឬ OGG ឬ​យក​វា​ពី​ប្រវត្តិ​របស់​អ្នក & # 160; ។ ដើម្បី​ធ្វើ​ការងារ Tortoise ដោយ​ស្វ័យប្រវត្តិ ហៅ TextToSpeechAI API និង​បញ្ជូន​ការ​កំណត់​គុណភាព​ដែល​បាន​ជ្រើស​របស់​អ្នក​ជាមុន - ចងចាំ​អនុញ្ញាត​ឲ្យ​អស់​ពេល​យូរ​ជាង​នេះ ពីព្រោះ Tortoise បង្ហាញ​យឺត & # 160; ។

ឆ្កែ​ឆ្កួត TTS API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoise ចំណាយ​ពេល​របស់​វា ប៉ុន្តែ​លទ្ធផល​គឺ​មាន​តម្លៃ​រង់ចាំ \u0026 # 160\u003B ។",
    "voice": "tortoise-angie"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

Tortoise TTS គឺ​ជា​គំរូ​អត្ថបទ​ទៅ​ជា​សំឡេង​ដែល​បង្កើត​ដោយ James Betker ដែល​ផ្តល់​អាទិភាព​ដល់​គុណភាព​អូឌីយ៉ូ​លើ​អ្វី​ផ្សេង​ទៀត & # 160; ។ វា​រួម​បញ្ចូល​គ្នា​នូវ​ការ​រចនា​ភាសា​ដែល​មាន​មូលដ្ឋាន​លើ​ឧបករណ៍​បម្លែង​ជាមួយ​ការ​ឌិកូដ​ការ​បំភាយ​ដើម្បី​បង្កើត​ការ​និយាយ​ដែល​មាន​ភាព​ធម្មជាតិ​មិន​អាច​ប្រៀប​ធៀប​បាន ជម្រៅ​អារម្មណ៍ និង​ការ​និយាយ​ដូច​មនុស្ស & # 160; ។ វា​ត្រូវ​បាន​ចាត់​ទុក​ជា​ទូទៅ​ថា​ជា​ម៉ាស៊ីន TTS ប្រភព​បើក​ចំហ​ដែល​មាន​ពិត​បំផុត​មួយ & # 160; ។

បាទ/ ចាស ។ Tortoise TTS គឺជាប្រភពបើកចំហក្រោមអាជ្ញាប័ណ្ណ Apache 2.0 ដែលអនុញ្ញាតឱ្យប្រើពាណិជ្ជកម្ម ការកែប្រែនិងចែកចាយឡើងវិញ ។ នៅលើ TextToSpeechAI Tortoise អង្គុយនៅក្នុងកម្រិតអាល់តឺនៅ 50 ក្រេឌីតក្នុងមួយ 1000 តួអក្សរដោយសារតែតម្រូវការគណនាធ្ងន់ធ្ងរនិងគុណភាពលទ្ធផលពិសេស ។

Tortoise គឺ​យឺត​ដោយ​រចនា​បថ & # 160; ៖ វា​បង្កើត​ចន្លោះ​បេក្ខជន​ជាច្រើន​ដោយ​ស្វ័យ​ប្រវត្តិ ហើយ​បន្ទាប់​មក​កែ​លម្អ​មួយ​ដែល​ល្អ​បំផុត​ជាមួយ​នឹង​គំរូ​ចម្រុះ និង​ជំហាន​ដាក់​ចំណាត់​ថ្នាក់​ឡើងវិញ CLVP & # 160; ។ គុណភាព​ដំបូង​នេះ​មាន​ន័យ​ថា​ចន្លោះ​តែ​មួយ​អាច​យក​ពី ៣០ វិនាទី​ទៅ​នាទី​ជាច្រើន​អាស្រ័យ​លើ​ប្រវែង​អត្ថបទ និង​គុណភាព​ដែល​បាន​កំណត់​ជា​មុន & # 160; ។ ការ​ផ្លាស់ប្ដូរ​គឺ​ថា Tortoise ផលិត​ការ​និយាយ​ធម្មជាតិ​បំផុត​របស់​ម៉ាស៊ីន TTS ណាមួយ & # 160; ។

Tortoise offers four presets that trade speed for quality: ultra_fast (~10x faster, good for testing), fast (~4x faster, the production default), standard (balanced), and high_quality (maximum quality, slowest). Higher presets sample more candidates and run more diffusion steps before selecting the best result. On TextToSpeechAI you can pick a preset before generating.

បាទ/ ចាស Tortoise TTS គាំទ្រ​ការ​ក្លូន​សំឡេង​ដោយ​ភាព​ស្មោះត្រង់​ពិសេស & # 160; ។ ផ្ដល់​នូវ​វីដេអូ​យោង​ខ្លី​មួយ​ចំនួន​នៃ​សំឡេង​គោលដៅ (ល្អ​បំផុត 3- 10 គំរូ​នៃ 5- 10 វិនាទី​នីមួយៗ) និង Tortoise ចាប់​យក​សំឡេង​របស់​អ្នក​និយាយ វោហាសាស្ត្រ ល្បឿន និង​ការ​បង្ហាញ​តូច​ៗ & # 160; ។ វា​ជា​ម៉ាស៊ីន​ក្លូន​ដែល​ត្រឹមត្រូវ​បំផុត​មួយ​ដែល​មិន​បាន​បាញ់​សូន្យ ទោះ​បី​ជា​ក្លូន​បន្ថែម​ទៅ​ពេល​បង្កើត​ដែល​បាន​យូរ​ហើយ & # 160; ។

Tortoise ត្រូវ​បាន​បណ្តុះ​បណ្តាល​ជា​ចម្បង​លើ​សំណុំ​ទិន្នន័យ​និយាយ​ភាសា​អង់គ្លេស ដូច្នេះ​ភាសា​អង់គ្លេស​គឺ​ជា​កន្លែង​ដែល​គុណភាព​របស់​វា​ខ្លាំង​បំផុត ។ សម្រាប់​គម្រោង​ភាសា​ច្រើន​ដែល​ត្រូវការ​ភាព​ពិត​ដូច​គ្នា ពិចារណា F5- TTS ឬ CosyVoice2 នៅ​លើ TextToSpeechAI ដែល​គាំទ្រ​ភាសា​ច្រើន​ខណៈ​ពេល​ដែល​នៅ​តែ​ផ្ដល់​ការ​ក្លូន​សំឡេង ។

Tortoise ផលិត​ជា​លើក​ដំបូង​, ជា​ញឹកញាប់​មិន​អាច​បែង​ចែក​ពី​មនុស្ស​អូឌីយ៉ូ. វា​ចាប់​យក​ដកដង្ហើម, ភាព​ស្ទាក់ស្ទើរ, intonation, និង​អារម្មណ៍​ពិត​ប្រាកដ​ដែល​ម៉ូដែល​ភ្លឺ​បាត់. នេះ​ជា​មូលហេតុ​ដែល​វា​នៅ​តែ​ជា​ការ​ពេញ​និយម​សម្រាប់​សៀវភៅ​អូឌីយ៉ូ​ប្រាក់​រង្វាន់, ភាពយន្ត​និយាយ, និង​ខ្ពស់-ចុង​បញ្ចប់​នៃ​ការ​សម្ដែង​ដែល​ការ​ពិត​គឺ​ជា​សំខាន់.

Tortoise ជាធម្មតាត្រូវការ 12-24GB នៃ VRAM អាស្រ័យលើគុណភាពដែលបានកំណត់ជាមុននិងទំហំបាច់ដូច្នេះ GPU ខ្ពស់ដូចជា RTX 3090, 4090 ឬ A100 ត្រូវបានផ្ដល់អនុសាសន៍សម្រាប់ការប្រើប្រាស់ក្នុងស្រុក។ ការសន្និដ្ឋាន CPU គឺអាចធ្វើទៅបានតាមបច្ចេកទេសប៉ុន្តែយឺតណាស់។ លើ TextToSpeechAI ម៉ូដែលរត់នៅលើហេដ្ឋារចនាសម្ព័ន្ធ GPU របស់យើងដូច្នេះអ្នកមិនត្រូវការផ្នែករឹងណាមួយរបស់ខ្លួនឯងទេ។

Tortoise បង្ហាញ​គុណភាព​ខ្ពស់​ 24kHz WAV អូឌីយ៉ូ​ដើម ។ តាមរយៈ TextToSpeechAI អ្នក​អាច​ស្នើ​សុំ MP3, WAV, ឬ OGG ហើយ​យើង​បម្លែង​កូដ​ជាមួយ​ការ​អ៊ិនកូដ​រក្សា​គុណភាព ដូច្នេះ​អ្នក​រក្សា​ទុក​លម្អិត​ល្អ​របស់​ម៉ូដែល​ក្នុង​ទ្រង់ទ្រាយ​ដែល​គម្រោង​របស់អ្នក​ត្រូវការ ។

Tortoise គឺនៅក្នុងកម្រិតតម្លៃអាល់តឺនៅ 50 ឥណទានក្នុងមួយ 1000 តួអក្សរ, ឆ្លុះបញ្ចាំងពីពេលវេលា GPU គុណភាពដំបូងរបស់ខ្លួនបំពង់ប្រើប្រាស់. គណនីថ្មីទទួលបានឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃ, ដូច្នេះអ្នកអាចសាកល្បង Tortoise មុនពេលប្តេជ្ញាចិត្ត. កម្រិតអាល់តឺក៏គ្របដណ្តប់ StyleTTS2, OpenVoice, Dia, និង Zonos.

ទាំងពីរគឺម៉ាស៊ីនកម្រិតខ្ពស់, ប៉ុន្តែពួកគេធ្វើពាណិជ្ជកម្មខុសគ្នា. Tortoise TTS ឈានដល់កំពូលនៃធម្មជាតិនិងជម្រៅអារម្មណ៍ពិតប្រាកដប៉ុន្តែវាជាម៉ាស៊ីនយឺតបំផុត. StyleTTS2 ផ្តល់នូវគុណភាពជិត-Tortoise ជាមួយនឹងការបង្កើតលឿនជាងនេះ, ធ្វើឱ្យវាជាជម្រើសល្អប្រសើរនៅពេលអ្នកត្រូវការវីដេអូច្រើនឬការត្រឡប់មកវិញលឿន. Pick Tortoise នៅពេលគុណភាពគឺមិនអាចចរចាបាននិងពេលវេលាគឺមិនត្រូវបានកំណត់.

Yes. Sign up on TextToSpeechAI to receive free starter credits, or use the demo on the homepage, and select a Tortoise voice to generate a clip without installing anything. Because Tortoise is slow, start with a short sentence and the "fast" preset to see the quality before running longer jobs.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try ឆ្កែ​ឆ្កួត TTS Now

Generate your first audio free. No credit card required.

Start Free