តំបន់

Ultra

ការ​ក្លូន​សំឡេង​ដែល​បង្ហាញ​ដោយ​មាន​អារម្មណ៍ និង​ការ​ត្រួតពិនិត្យ​រចនាប័ទ្ម

Medium ល្បឿន​
Excellent គុណភាព
បាទ/ ចាស ក្លូន
5 ភាសា

អំពី តំបន់

s. It supports voice cloning from 5-30 seconds of reference audio and can modulate the emotional tone of generated audios to create voices. It supports voice cloning from 5-30 seconds of reference audio and can modulate the emotional tone of generated audios to create voices. It supports voice cloning from 5-30 seconds of reference audio and can modulate emotions to create

លក្ខណៈ​ពិសេស​សំខាន់

ត្រួតពិនិត្យ​អារម្មណ៍

ត្រួតពិនិត្យ​អារម្មណ៍​និយាយ & # 160; ៖ សេចក្តី​សុខ ទុក្ខ ខឹង ខ្លាច ភ្ញាក់ផ្អើល ស្អប់ និង​អព្យាក្រឹត & # 160; ។

ការ​ក្លូន​សំឡេង

ក្លូន​សំឡេង​ណាមួយ​ពី 5-30 វិនាទី​នៃ​អូឌីយ៉ូ​យោង​ជាមួយ​ភាព​ត្រឹមត្រូវ​ខ្ពស់ ។

ការ​និយាយ​ដែល​មាន​លក្ខណៈ​បង្ហាញ

ប៉ារ៉ាម៉ែត្រ 1.6B ផលិតការនិយាយបង្ហាញខ្ពស់ជាមួយនឹងការដឹកជញ្ជូនអារម្មណ៍ nuanced ។

ភាសា​ច្រើន

គាំទ្រ​ភាសា​អង់គ្លេស ជប៉ុន ចិន បារាំង និង​អាល្លឺម៉ង់ ។

ករណី​ប្រើ

ការ​បង្កើត​មាតិកា​ដែល​បង្ហាញ​អារម្មណ៍ សំឡេង​តួអក្សរ​ល្បែង​ជាមួយ​អារម្មណ៍ ការ​និយាយ​សៀវភៅ​អូឌីយ៉ូ​ជាមួយ​អារម្មណ៍ បទពិសោធន៍​សំឡេង​អន្តរកម្ម

របៀប​ប្រើ តំបន់

  1. 1

    ចុះឈ្មោះ ឬ​បើក​ការ​បង្ហាញ​សាកល្បង

    បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទទួលបានប្រាក់រង្វាន់ចាប់ផ្តើមដំបូងឬប្រើការបង្ហាញមិនចុះឈ្មោះដើម្បីសាកល្បង Zonos ភ្លាមៗ។

  2. 2

    ជ្រើស​ម៉ាស៊ីន Zonos

    ជ្រើស Zonos ពី​សំឡេង និង​កម្មវិធី​ជ្រើស​ម៉ូដែល & # 160; ។ ដើម្បី​ក្លូន​សំឡេង ផ្ទុក​ឡើង ៥- ៣០ វិនាទី​នៃ​អូឌីយ៉ូ​យោង​ស្អាត ដូច្នេះ Zonos អាច​ផ្គូផ្គង​អ្នក​និយាយ & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក

    វាយ ឬ​បិទភ្ជាប់​ស្គ្រីប​ដែល​អ្នក​ចង់​និយាយ & # 160; ។ Zonos ធ្វើការ​នៅ​លើ​ភាសា​អង់គ្លេស ជប៉ុន ចិន បារាំង និង​អាល្លឺម៉ង់ & # 160; ។

  4. 4

    ជ្រើស​អារម្មណ៍ និង​បង្កើត

    ជ្រើស​អារម្មណ៍​មួយ​ក្នុង​ចំណោម​អារម្មណ៍​ទាំង​ប្រាំ​របស់ Zonos - អព្យាក្រឹតភាព សេចក្តី​សប្បាយ​រីករាយ ទុក្ខសោក ខឹង ខ្លាច ភ្ញាក់ផ្អើល ឬ​ស្អប់ - បន្ទាប់​មក​ចុច​បង្កើត ដើម្បី​បង្ហាញ​ការ​និយាយ​ដែល​មាន​ន័យ​ក្នុង​អារម្មណ៍​នោះ & # 160; ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    ចាក់​ឡើងវិញ និង​ទាញ​យក​អូឌីយ៉ូ​ដែល​បាន​បញ្ចប់ ឬ​ហៅ​ម៉ាស៊ីន Zonos ដូចគ្នា​ដោយ​កម្មវិធី​តាមរយៈ TextToSpeechAI REST API សម្រាប់​លំហូរ​ការងារ​ស្វ័យប្រវត្តិ ។

តំបន់ API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Zonos បង្កើត​ការ​និយាយ​ដែល​មាន​ការ​បង្ហាញ​មិន​គួរ​ឲ្យ​ជឿ​ជាមួយ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ដែល​មាន​គ្រាប់​ល្អ ។",
    "voice": "en_US-lessac-medium"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

Zonos គឺ​ជា​ម៉ូដែល​អត្ថបទ​ទៅ​ជា​សំឡេង​ប៉ារ៉ាម៉ែត្រ 1.6B ពី Zyphra ។ វា​មាន​ជំនាញ​ក្នុង​ការ​បង្កើត​ការ​និយាយ​ប្រកប​ដោយ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ល្អ និង​ការ​ក្លូន​សំឡេង​ខ្ពស់ ។ នៅ​លើ TextToSpeechAI វា​រត់​ជា​ម៉ាស៊ីន​កម្រិត​ខ្ពស់​សម្រាប់​អូឌីយ៉ូ​ដែល​មាន​អារម្មណ៍​សម្បូរ​បែប​បំផុត ។

បាទ. Zonos ត្រូវបានចេញផ្សាយក្រោមអាជ្ញាប័ណ្ណ Apache 2.0 សម្រាប់ទាំងកូដនិងទំងន់ម៉ូដែលរបស់ខ្លួន, ដូច្នេះវាអាចត្រូវបានប្រើដោយសេរីនៅក្នុងផលិតផលពាណិជ្ជកម្មដោយគ្មានការបញ្ជាក់ឬការកំណត់មិនពាណិជ្ជកម្ម. ដែលធ្វើឱ្យវាមានសុវត្ថិភាពសម្រាប់កម្មវិធីដែលបង់ប្រាក់, ការងារអតិថិជននិងមាតិកា monetized.

Zonos បង្ហាញ​ស្ថានភាព​អារម្មណ៍​ប្រាំ​មួយ - អព្យាក្រឹត សប្បាយ​រីករាយ សោកសៅ ខឹង ខ្លាច ភ្ញាក់ផ្អើល និង​ស្អប់​ខ្ពើម - ដែល​អ្នក​ជ្រើស​មុន​ពេល​បង្កើត & # 160; ។ ម៉ូដែល​កំណត់​លក្ខខណ្ឌ​ការ​ផ្ដល់​របស់​វា​លើ​អារម្មណ៍​ដែល​បាន​ជ្រើស ផ្លាស់ប្ដូរ​សំឡេង ល្បឿន និង​អោន​ដូច្នេះ​ឃ្លា​ដូចគ្នា​អាច​មាន​សំឡេង​រីករាយ ឬ​ខឹង & # 160; ។ នេះ​ធ្វើ​ឲ្យ Zonos ល្អ​សម្រាប់​សំឡេង​តួអក្សរ និង​ប្រអប់​ដែល​ត្រូវការ​អារម្មណ៍​ជាក់លាក់ & # 160; ។

Zonos គាំទ្រ​ជម្រើស​អារម្មណ៍​ប្រាំ​មួយ & # 160; ៖ អព្យាក្រឹតភាព សេចក្តី​សប្បាយ​រីករាយ ទុក្ខ​សោក ខឹង ខ្លាច ភ្ញាក់ផ្អើល និង​ស្អប់ & # 160; ។ អ្នក​ជ្រើស​មួយ​ក្នុង​មួយ​ជំនាន់​ដើម្បី​កំណត់​សំឡេង​អារម្មណ៍​នៃ​ចន្លោះ​ទាំង​មូល & # 160; ។

បាទ/ ចាស & # 160; ។ Zonos ក្លូន​សំឡេង​ពី​តែ 5- 30 វិនាទី​នៃ​សំឡេង​យោង ដក​យក​លក្ខណៈ​ពិសេស​របស់​អ្នក​និយាយ និង​បង្កើត​ពួក​វា​ជា​ការ​និយាយ​ថ្មី & # 160; ។ អ្នក​អាច​រួម​បញ្ចូល​ការ​ក្លូន​ជាមួយ​នឹង​អារម្មណ៍​ទាំង​ប្រាំ​មួយ​ដើម្បី​ធ្វើ​ឲ្យ​សំឡេង​ក្លូន​មាន​សំឡេង​សប្បាយ​រីករាយ ខឹង ឬ​ភ័យ​ខ្លាច & # 160; ។

Zonos គ្រប់គ្រង​ភាសា​ប្រាំ​ភាសា: អង់គ្លេស, ជប៉ុន, ចិន, បារាំង និង​អាល្លឺម៉ង់ ។ ត្រួតពិនិត្យ​អារម្មណ៍ និង​ការ​ក្លូន​សំឡេង​ធ្វើការ​នៅ​លើ​ភាសា​ទាំងអស់​នេះ ។

Zonos រត់នៅល្បឿនមធ្យមដោយសារតែទំហំប៉ារ៉ាម៉ែត្រ 1.6B របស់ខ្លួន, ការជួញដូរការឆ្លងកាត់ដើមសម្រាប់ល្អ, លទ្ធផលបង្ហាញខ្ពស់. គុណភាពគឺក្នុងចំណោមល្អបំផុតសម្រាប់អារម្មណ៍និងពាក្យសម្ដីក្លែងក្លាយ, ដូច្នេះវាសមនឹងផលិតកម្មចុងក្រោយអូឌីយ៉ូជំនួសឱ្យការបង្កើតពេលវេលាពិត bulk.

Zonos ត្រូវការ 8GB ឬច្រើនជាង VRAM សម្រាប់ម៉ូដែលប៉ារ៉ាម៉ែត្រ 1.6B របស់វា។ GPU ដែលមានយ៉ាងហោចណាស់ 10GB ត្រូវបានផ្ដល់អនុសាសន៍សម្រាប់ប្រតិបត្តិការងាយស្រួលនៅពេលរួមបញ្ចូលគ្នាជាមួយការក្លែងបន្លំសំឡេងជាមួយការត្រួតពិនិត្យអារម្មណ៍។ នៅលើ TextToSpeechAI ទាំងអស់នេះរត់នៅលើ GPU backend របស់យើងដូច្នេះអ្នកមិនត្រូវការផ្នែករឹងផ្ទាល់ខ្លួនរបស់អ្នកទេ។

Zonos គឺ​ជា​ម៉ាស៊ីន​កម្រិត​ខ្ពស់​មួយ​ដែល​ត្រូវ​បាន​បង់​ប្រាក់​នៅ​ 50 ពិន្ទុ​ក្នុង​មួយ​តួអក្សរ 1, 000 ។ កម្រិត​ខ្ពស់​បង្ហាញ​ពី​ម៉ូដែល​ធំ​របស់​វា និង​អារម្មណ៍​កម្រិត​ខ្ពស់ និង​សមត្ថភាព​ក្លូន​កម្រិត​ដូចគ្នា​នឹង StyleTTS2, Tortoise និង OpenVoice ។

ទាំង​ពីរ​ផ្ដល់​រចនាប័ទ្ម និង​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ជាមួយ​ការ​ក្លូន​សំឡេង & # 160; ។ Zonos ផ្ដល់​ស្ថានភាព​អារម្មណ៍​ដាច់​ដោយឡែក​ប្រាំ​មួយ និង​ស្ថាបត្យកម្ម​ទំនើប 1.6B ខណៈ​ពេល OpenVoice ផ្ដល់​រចនាប័ទ្ម​សំឡេង​ដូចជា​មិត្ត​ភក្តិ សប្បាយ​រីករាយ និង​ស្រែក​ជាមួយ​ការ​ក្លូន​ភ្លាមៗ​យ៉ាង​លឿន & # 160; ។ ជ្រើស Zonos ពេល​អ្នក​ចង់​ជ្រើស​អារម្មណ៍​ច្បាស់លាស់ និង​ការ​បង្ហាញ​អតិបរមា ជ្រើស OpenVoice សម្រាប់​ការ​ផ្លាស់ប្ដូរ​សំឡេង​លឿន​ជាង​មុន & # 160; ។

Bark បន្ថែម​សញ្ញា​សម្គាល់​បង្ហាញ​ដូច​ជា [លាន់មាត់] និង [សើច] ប៉ុន្តែ​ផ្ដល់​ការ​ក្លូន​ដែល​មាន​កម្រិត ហើយ Dia ផ្តោត​លើ​ប្រអប់​សម្លេង​ច្រើន​ជាមួយ​សំឡេង​មិន​និយាយ & # 160; ។ Zonos ផ្តោត​លើ​ការ​ជ្រើស​អារម្មណ៍​ច្បាស់លាស់​បន្ថែម​លើ​ក្លូន​សំឡេង​តែ​មួយ​ដែល​ខ្លាំង ផ្តល់​ឲ្យ​អ្នក​នូវ​ការ​ត្រួតពិនិត្យ​ជាក់លាក់​លើ​អារម្មណ៍​នៃ​ចន្លោះ​នីមួយៗ & # 160; ។ ជ្រើស​ម៉ាស៊ីន​ដែល​ផ្គូផ្គង​ថាតើ​អ្នក​ត្រូវការ​ស្លាក​អារម្មណ៍ បង្វិល​ប្រអប់ ឬ​អារម្មណ៍​ដែល​អាច​ជ្រើស & # 160; ។

បាទ/ចាស។ គណនីថ្មី TextToSpeechAI ទទួលបានឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃហើយការបង្ហាញអនុញ្ញាតឱ្យអ្នកបង្កើតអូឌីយ៉ូគំរូដោយមិនចាំបាច់ចុះឈ្មោះ។ នោះគឺគ្រប់គ្រាន់ដើម្បីសាកល្បងការគ្រប់គ្រងអារម្មណ៍និងក្លែងបន្លំសំឡេងមុនពេលទិញឥណទានបន្ថែម។

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try តំបន់ Now

Generate your first audio free. No credit card required.

Start Free