បើក​សំឡេង

Ultra

ការ​ក្លូន​សំឡេង​ភ្លាមៗ​ជាមួយ​ការ​ត្រួតពិនិត្យ​សំឡេង​ក្រាស់

Moderate ល្បឿន​
Very Good គុណភាព
បាទ/ ចាស ក្លូន
10 ភាសា

អំពី បើក​សំឡេង

of the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the

លក្ខណៈ​ពិសេស​សំខាន់

ការ​ក្លូន​ភ្លាមៗ

ក្លូន​សំឡេង​ណាមួយ​ពី​អូឌីយ៉ូ​មួយ​ចំនួន​វិនាទី ។

ត្រួតពិនិត្យ​សំឡេង

អនុវត្ត​សំឡេង​រីករាយ សោកសៅ ខឹង រំភើប ឬ​ស្រែក & # 160; ។

ផ្ទេរ​រចនាប័ទ្ម

បំបែក​អត្តសញ្ញាណ​សំឡេង​ពី​រចនាប័ទ្ម​និយាយ​សម្រាប់​ភាព​អាច​ផ្លាស់ប្ដូរ​បាន & # 160; ។

ភាសា​ចម្រុះ

ប្រើ​សំឡេង​ក្លូន​នៅ​លើ​ភាសា​ផ្សេង​គ្នា & # 160; ។

ការ​ដំណើរការ​លឿន

ការ​សន្និដ្ឋាន​ដែល​មាន​ប្រសិទ្ធភាព​សម្រាប់​ការ​បង្កើត​សំឡេង​រហ័ស & # 160; ។

ប្រភព​បើកចំហ

MIT អាជ្ញាប័ណ្ណ​សម្រាប់​កម្មវិធី​ពាណិជ្ជកម្ម & # 160; ។

ករណី​ប្រើ

មាតិកា​អារម្មណ៍ ចលនា​តួអក្សរ ល្បែង​អន្តរកម្ម ការ​និយាយ​សៀវភៅ​អូឌីយ៉ូ វីដេអូ​ទីផ្សារ ជំនួយការ​និម្មិត

របៀប​ប្រើ បើក​សំឡេង

  1. 1

    ចុះឈ្មោះដោយឥតគិតថ្លៃឬព្យាយាមបង្ហាញ

    បង្កើត​គណនី TextToSpeechAI ឥតគិតថ្លៃ​ដើម្បី​ទទួល​បាន​ប្រាក់​រង្វាន់​ចាប់ផ្ដើម ឬ​ប្រើ​ការ​បង្ហាញ​លើ​ទំព័រ​ដើម្បី​ស្តាប់ OpenVoice មុន​ពេល​ធ្វើ​ការ​ប្តេជ្ញាចិត្ត ។ គ្មាន​ GPU ឬ​ការ​ដំឡើង​មូលដ្ឋាន​ដែល​ត្រូវការ​ទេ - គ្រប់​យ៉ាង​រត់​លើ​ម៉ាស៊ីន​បម្រើ​របស់យើង ។

  2. 2

    ជ្រើស OpenVoice និង​ផ្ទុក​ឡើង​ចន្លោះ​ពេល​យោង

    ជ្រើស​ម៉ាស៊ីន OpenVoice បន្ទាប់​មក​ផ្ទុក​ឡើង​មួយ​ចំនួន​វិនាទី​នៃ​សំឡេង​យោង​ស្អាត​ដើម្បី​ក្លូន​សំឡេង​គោលដៅ​ភ្លាមៗ & # 160; ។ OpenVoice ចាប់​យក​អត្តសញ្ញាណ​អ្នក​និយាយ ដូច្នេះ​អ្នក​អាច​ប្រើ​វា​ឡើងវិញ​តាម​រយៈ​អត្ថបទ និង​សំឡេង​ណាមួយ & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក

    វាយ ឬ​បិទភ្ជាប់​ស្គ្រីប​ដែល​អ្នក​ចង់​និយាយ​ក្នុង​សំឡេង​ក្លូន & # 160; ។ OpenVoice គាំទ្រ​ភាសា​ប្រហែល ១០ និង​ការ​ផ្ដល់​ភាសា​ឆ្លងកាត់ ដូច្នេះ​អ្នក​អាច​សរសេរ​ក្នុង​ភាសា​ផ្សេង​ពី​ចន្លោះ​យោង & # 160; ។

  4. 4

    ជ្រើស​រចនាប័ទ្ម​សំឡេង និង​បង្កើត

    ជ្រើស​មួយ​ក្នុង​ចំណោម​រចនាប័ទ្ម​សំឡេង​របស់ OpenVoice ៩ - លំនាំដើម មិត្ត​ភក្តិ សប្បាយ​រីករាយ រំភើប សោកសៅ ខឹង ភ័យ​ខ្លាច ស្រែក ឬ​ស្រែក​ - បន្ទាប់​មក​បង្កើត & # 160; ។ សំឡេង​ដែល​បាន​ក្លូន​ដូចគ្នា​នឹង​និយាយ​ជាមួយ​ការ​ផ្ដល់​អារម្មណ៍​នោះ & # 160; ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    ទាញយកអូឌីយ៉ូរបស់អ្នកជា MP3, WAV, ឬ OGG, ឬបង្កើតដោយស្វ័យប្រវត្តិតាមរយៈ TextToSpeechAI API ដោយឆ្លងកាត់សំឡេងនិងរចនាប័ទ្មសំឡេងក្លូនរបស់អ្នកនៅក្នុងសំណើនីមួយៗ។

បើក​សំឡេង API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice អាច​និយាយ​ក្នុង​សំឡេង​ណា​មួយ \u002D សប្បាយ​រីករាយ សោកសៅ ឬ​សូម្បី​តែ​ស្រែក​តិចៗ \u0026 # 160\u003B ។",
    "voice": "en_US-lessac-medium"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

OpenVoice គឺ​ជា​អត្ថបទ​ទៅ​ការ​និយាយ​កម្រិត​ខ្ពស់ និង​ម៉ូដែល​ក្លូន​សំឡេង​ដែល​បំបែក​អត្តសញ្ញាណ​សំឡេង​ពី​រចនាប័ទ្ម​និយាយ​ដោយ​មាន​លក្ខណៈ​ពិសេស & # 160; ។ វា​អនុញ្ញាត​ឲ្យ​អ្នក​ក្លូន​សំឡេង ហើយ​បន្ទាប់​មក​អនុវត្ត​តន្ត្រី​អារម្មណ៍​ផ្សេង​គ្នា​ដោយ​មិន​ចាំបាច់​អូឌីយ៉ូ​យោង​ថ្មី​សម្រាប់​អារម្មណ៍​នីមួយៗ & # 160; ។ វា​ត្រូវ​បាន​សាងសង់​សម្រាប់​ការ​បង្កើត​ការ​និយាយ​ដែល​អាច​គ្រប់គ្រង​បាន & # 160; ។

បាទ OpenVoice ធ្វើ​ការ​ក្លូន​សំឡេង​ភ្លាមៗ​ពី​អូឌីយ៉ូ​យោង​តែ​មួយ​ភ្លែត​ប៉ុណ្ណោះ - មិន​ចាំបាច់​រត់​ការ​បណ្តុះ​បណ្តាល​ទេ & # 160; ។ ពេល​សំឡេង​ត្រូវ​បាន​ចាប់​យក OpenVoice អាច​ប្រើ​អត្តសញ្ញាណ​នោះ​ឡើងវិញ​តាម​រយៈ​អត្ថបទ​ណាមួយ និង​រចនាប័ទ្ម​សំឡេង​ណាមួយ​ដែល​អ្នក​ជ្រើស & # 160; ។

OpenVoice ប្រើ​ស្ថាបត្យកម្ម​ដំណាក់កាល​ពីរ​ដែល​បំបែក​ការ​សំយោគ​សំឡេង​មូលដ្ឋាន​ពី​ការ​បម្លែង​សំឡេង & # 160; ។ បន្ទាប់​ពី​ក្លូន​សំឡេង អ្នក​អាច​អនុវត្ត​រចនាប័ទ្ម​សំឡេង​ទាំង​៩​ដែល​មាន​ដូច​គ្នា - លំនាំដើម មិត្ត​ភាព សប្បាយ​រីករាយ រំភើប សោកសៅ ខឹង ភ័យ​ខ្លាច យំ ឬ​ស្រែក - និង​សំឡេង​ដែល​ក្លូន​ដូចគ្នា​និយាយ​ខុសៗ​គ្នា​ផ្អែក​លើ​សំឡេង​ដែល​អ្នក​ជ្រើស​ដោយ​មិន​ថត​ម្ដង​ទៀត & # 160; ។

OpenVoice គាំទ្រ​រចនាប័ទ្ម​និយាយ​ប្រាំមួយ & # 160; ៖ លំនាំដើម មិត្ត​ភក្តិ សប្បាយ​រីករាយ រំភើប សោកសៅ ខឹង ភ័យ​ខ្លាច ស្រែក និង​ស្រែក​ខ្សឹប & # 160; ។ រចនាប័ទ្ម​នីមួយៗ​បង្កើត​ការ​ផ្ដល់​អារម្មណ៍​ឡើងវិញ​ខណៈ​ពេល​រក្សា​អត្តសញ្ញាណ​អ្នក​និយាយ​ដែល​បាន​ក្លូន ផ្តល់​ឲ្យ​អ្នក​នូវ​ការ​ត្រួតពិនិត្យ​ល្អិតល្អន់​លើ​របៀប​ដែល​បន្ទាត់​ត្រូវ​បាន​អាន & # 160; ។

OpenVoice គឺ​ជា​ប្រភព​បើក​ចំហ​ក្រោម​អាជ្ញាប័ណ្ណ MIT ដែល​អនុញ្ញាត ដូច្នេះ​វា​គឺ​ឥត​គិត​ថ្លៃ​សម្រាប់​ការ​ប្រើ​ពាណិជ្ជកម្ម & # 160; ។ ដូច​ជា​ម៉ូដែល​ក្លូន​ណា​មួយ​ដែរ សូម​ប្រាកដ​ថា​អ្នក​មាន​សិទ្ធិ​ត្រឹមត្រូវ​ចំពោះ​សំឡេង​ណា​មួយ​ដែល​អ្នក​ក្លូន​សម្រាប់​គម្រោង​ពាណិជ្ជកម្ម & # 160; ។

OpenVoice គាំទ្រ​ភាសា​ប្រមាណ​ជា ១០ រួម​មាន​ភាសា​អង់គ្លេស ចិន ជប៉ុន កូរ៉េ និង​ភាសា​អឺរ៉ុប​ជាច្រើន ។ វា​ក៏​ផ្ដល់​នូវ​ការ​ចម្លង​ភាសា​ឆ្លងកាត់​ផងដែរ ដូច្នេះ​អ្នក​អាច​ចម្លង​សំឡេង​ក្នុង​ភាសា​មួយ ហើយ​វា​និយាយ​ដោយ​ធម្មជាតិ​ក្នុង​ភាសា​មួយ​ទៀត ។

OpenVoice មាន​ល្បឿន​បង្កើត​សមរម្យ ជា​ធម្មតា​បង្ហាញ​ឃ្លា​ក្នុង 2-4 វិនាទី​លើ GPU ។ គុណភាព​លទ្ធផល​គឺ​ល្អ​ណាស់ ជាមួយ​ការ​បង្កើត​សំឡេង​ច្បាស់លាស់ និង​ការ​ផ្ទេរ​សំឡេង​ដែល​រក្សា​អត្តសញ្ញាណ​អ្នក​និយាយ​មិន​ខូច​ខណៈ​ពេល​ផ្លាស់ប្ដូរ​ការ​ផ្ដល់​អារម្មណ៍​យ៉ាង​ជឿជាក់ ។

OpenVoice ជាធម្មតាត្រូវការ 6-8GB នៃ VRAM អាស្រ័យលើទំហំ batch និងការផ្ទុកការបម្លែងសំឡេង។ វារត់យ៉ាងងាយស្រួលនៅលើជួរកណ្តាលទៅ GPUs ជួរកណ្តាលខាងលើហើយនៅលើ TextToSpeechAI នេះទាំងអស់ត្រូវបានដោះស្រាយនៅលើម៉ាស៊ីនបម្រើរបស់យើងដូច្នេះអ្នកមិនត្រូវការផ្នែករឹងមូលដ្ឋានណាមួយឡើយ។

OpenVoice គឺ​ជា​ម៉ាស៊ីន​កម្រិត​ខ្ពស់​ដែល​មាន​តម្លៃ ៥០ គ្រីប​ក្នុង​មួយ​តួអក្សរ ១០០០ ។ កម្រិត​ខ្ពស់​បង្ហាញ​ពី​ការ​ត្រួតពិនិត្យ​សំឡេង​កម្រិត​ខ្ពស់​របស់​វា និង​ការ​គណនា​បន្ថែម​ដែល​ត្រូវការ​សម្រាប់​បំពង់​បម្លែង​រចនាប័ទ្ម​បន្ថែម​ទៀត ។

OpenVoice មាន​លក្ខណៈ​ពិសេស​សម្រាប់​ការ​ត្រួតពិនិត្យ​សំឡេង និង​រចនាប័ទ្ម​របស់​វា & # 160; ៖ អ្នក​អាច​យក​សំឡេង​ដែល​បាន​ក្លូន​មួយ​ ហើយ​ផ្ដល់​វា​ជា​ថ្មី​ជា​សប្បាយ​រីករាយ សោកសៅ ខឹង ឬ​ស្រែក & # 160; ។ F5- TTS គឺ​លឿន​ជាង ហើយ​ជា​ម៉ាស៊ីន​ក្លូន​លំនាំដើម​របស់​យើង​សម្រាប់​ការ​និយាយ​ធម្មតា​ដែល​មិន​មាន​ភាព​ខុស​គ្នា & # 160; ។ ជ្រើស OpenVoice ពេល​អ្នក​ត្រូវការ​ការ​ត្រួតពិនិត្យ​រចនាប័ទ្ម​អារម្មណ៍ និង F5- TTS ពេល​អ្នក​ចង់​បាន​ក្លូន​ធម្មជាតិ​លឿន​បំផុត & # 160; ។

បង្កើត​សំឡេង​ក្លូន​ដោយ​ផ្ទុក​អូឌីយ៉ូ​យោង​ឡើង បន្ទាប់​មក​បញ្ជាក់​រចនាប័ទ្ម​សំឡេង​ក្នុង​សំណើ API របស់​អ្នក & # 160; ។ API អនុវត្ត​សំឡេង​អារម្មណ៍​ដែល​បាន​ជ្រើស​របស់​អ្នក​ទៅ​សំឡេង​ក្លូន​ដោយ​ស្វ័យ​ប្រវត្តិ ហើយ​ត្រឡប់​អូឌីយ៉ូ​ក្នុង​ទ្រង់ទ្រាយ MP3 WAV ឬ OGG & # 160; ។

បាទ/ ចាស ។ ចុះឈ្មោះ​សម្រាប់​គណនី TextToSpeechAI ឥតគិតថ្លៃ​ដើម្បី​ទទួល​បាន​ប្រាក់​រង្វាន់​ចាប់ផ្ដើម និង​ព្យាយាម​ក្លូន OpenVoice និង​ការ​ត្រួតពិនិត្យ​សំឡេង​ ឬ​ប្រើ​ការ​បង្ហាញ​លើ​ទំព័រ​ដំបូង ។ គ្មាន​ការ​កំណត់​រចនាសម្ព័ន្ធ​មូលដ្ឋាន​ទេ - ផ្ទុក​ឡើង​វីដេអូ​យោង ជ្រើស​សំឡេង និង​បង្កើត​ក្នុង​កម្មវិធី​រុករក ។

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try បើក​សំឡេង Now

Generate your first audio free. No credit card required.

Start Free