សំឡេង​ស្រស់​ស្អាត ២Name

Premium

ការ​ក្លូន​សំឡេង​ច្រើន​ភាសា Zero-shot ដែល​គាំទ្រ​ស្ទ្រីម

Fast ល្បឿន​
Very Good គុណភាព
បាទ/ ចាស ក្លូន
5 ភាសា

អំពី សំឡេង​ស្រស់​ស្អាត ២Name

[Translation temporarily unavailable. Please try again.]

លក្ខណៈ​ពិសេស​សំខាន់

ការ​ក្លូន​សំឡេង Zero- Shot

ក្លូន​សំឡេង​ណាមួយ​ពី 3-10 វិនាទី​នៃ​អូឌីយ៉ូ​យោង​ជាមួយ​ភាព​ត្រឹមត្រូវ​ខ្ពស់ ។

ភាសា​ច្រើន

គាំទ្រ​ភាសា​ចិន អង់គ្លេស ជប៉ុន កូរ៉េ និង​កាតុង​ជាមួយ​ការ​សំយោគ​ភាសា​ឆ្លង ។

ការ​គាំទ្រ​ស្ទ្រីម

របៀប​ស្ទ្រីម​អត្រា​លោត​ទាប​សម្រាប់​កម្មវិធី​ពេល​ពិត និង​ប្រព័ន្ធ​អន្តរកម្ម & # 160; ។

វណ្ណយុត្ត​ធម្មជាតិ

ការ​បង្កើត​ម៉ូដែល​ប្រូសូឌី​កម្រិត​ខ្ពស់​បង្កើត​ការ​និយាយ​ដែល​មាន​សំឡេង​ធម្មជាតិ​ជាមួយ​នឹង​ការ​អោន​សមរម្យ & # 160; ។

ករណី​ប្រើ

ការ​បង្កើត​មាតិកា​ជា​ច្រើន​ភាសា អ្នក​ជំនួយការ​សំឡេង​ពេលវេលា​ពិត ការ​បកប្រែ​ភាសា​ផ្សេងគ្នា កម្មវិធី​សំឡេង​ផ្ទាល់ខ្លួន

របៀប​ប្រើ សំឡេង​ស្រស់​ស្អាត ២Name

  1. 1

    ចុះឈ្មោះនិងទាមទារឥណទានឥតគិតថ្លៃ

    បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទាមទារប្រាក់រង្វាន់ចាប់ផ្តើមរបស់អ្នកឬព្យាយាមបង្ហាញដំបូង. គ្មាន GPU ឬការដំឡើង CosyVoice2 មូលដ្ឋានគឺត្រូវការ - គ្រប់យ៉ាងរត់នៅលើហេដ្ឋារចនាសម្ព័ន្ធរបស់យើង.

  2. 2

    ជ្រើស CosyVoice2 ហើយ​បន្ថែម​ចាក់​វីដេអូ​យោង

    ជ្រើស CosyVoice2 ជា​ម៉ាស៊ីន​របស់​អ្នក បន្ទាប់​មក​ផ្ទុក​ការ​ថត​យោង​ស្អាត 3- 10 វិនាទី​នៃ​សំឡេង​ដែល​អ្នក​ចង់​ក្លូន & # 160; ។ CosyVoice2 នឹង​ស្រង់​លក្ខណៈ​ពិសេស​របស់​អ្នក​និយាយ​សម្រាប់​ក្លូន​ភាសា​ច្រើន​ដែល​មិន​បាន​ចាក់ & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក​ក្នុង​ភាសា​ដែល​បាន​គាំទ្រ​ណាមួយ

    វាយ ឬ​បិទភ្ជាប់​ស្គ្រីប​របស់​អ្នក​ជា​ភាសា​ចិន អង់គ្លេស ជប៉ុន កូរ៉េ ឬ​កាតុង ។ CosyVoice2គាំទ្រ​ការ​បង្កើត​ភាសា​ឆ្លងកាត់ ដូច្នេះ​សំឡេង​ដែល​បាន​ក្លូន​អាច​និយាយ​ភាសា​ផ្សេង​ពី​ចន្លោះ​យោង ។

  4. 4

    បង្កើត​ការ​និយាយ

    ចុចបង្កើតនិង CosyVoice2 សំយោគធម្មជាតិ, និយាយភាសាច្រើននៅក្នុងសំឡេងក្លូន, ជាធម្មតាក្នុងរយៈពេលពីរវិនាទីសម្រាប់អត្ថបទខ្លី. ការប្រើប្រាស់កម្រិតខ្ពស់ចំណាយ 25 ឥណទានក្នុងមួយ 1,000 តួអក្សរ.

  5. 5

    ទាញយក ឬ​ប្រើ API

    ទាញយកអូឌីយ៉ូដែលបានបញ្ចប់ជា MP3 ឬ WAV ពីប្រវត្តិរបស់អ្នកឬធ្វើស្វ័យប្រវត្តិ CosyVoice2 ក្លូនសំឡេងនៅទំហំតាមរយៈ TextToSpeechAI REST API ។

សំឡេង​ស្រស់​ស្អាត ២Name API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 ផ្ដល់​ការ​និយាយ​ជា​ភាសា​ច្រើន​ដោយ​មាន​សមត្ថភាព​ក្លូន​សំឡេង​សូន្យ​គ្រាប់​។",
    "voice": "en_US-lessac-medium"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

CosyVoice2 គឺជា អត្ថបទ ទៅកាន់ សម្ដី ជំនាន់ បន្ទាប់ និង គំរូ ក្លូន សំឡេង ពី FunAudioLLM (Alibaba) ។ វា គាំទ្រ ក្លូន សំឡេង ស៊េរី មួយ គ្រាប់ ពី មួយ វិនាទី នៃ សំឡេង យោង ហើយ អាច បង្កើត សម្លេង ធម្មជាតិ ក្នុង ភាសា ចិន អង់គ្លេស ជប៉ុន កូរ៉េ និង កា ណូត ។ នៅ លើ TextToSpeechAI អ្នក អាច រត់ CosyVoice2 ក្នុង កម្មវិធី រុករក ដោយ គ្មាន ការ កំណត់ រចនាសម្ព័ន្ធ មូលដ្ឋាន ណាមួយ ។

បាទ, CosyVoice2គឺពេញលេញ Apache 2.0 អាជ្ញាប័ណ្ណ - ទាំងកូដនិងទំងន់ម៉ូដែល. នេះធ្វើឱ្យវាមានសុវត្ថិភាពដើម្បីប្រើនៅក្នុងផលិតផលពាណិជ្ជកម្ម, មាតិកាដែលបានបង់ប្រាក់, និងការងាររបស់អតិថិជនដោយគ្មានថ្លៃអាជ្ញាប័ណ្ណឬការកំណត់មិនពាណិជ្ជកម្ម.

CosyVoice2 គាំទ្រ​ភាសា​ប្រាំ​ភាសា & # 160; ៖ ចិន (Mandarin) អង់គ្លេស ជប៉ុន កូរ៉េ និង​កាតុង ។ វា​ក៏​គ្រប់គ្រង​ការ​បង្កើត​ភាសា​ឆ្លងកាត់​ដែរ ដូច្នេះ​អ្នក​អាច​ក្លូន​សំឡេង​ពី​ការ​ថត​ក្នុង​ភាសា​មួយ និង​បង្កើត​ការ​និយាយ​ក្នុង​ភាសា​មួយ​ទៀត & # 160; ។

ផ្ដល់​នូវ​អូឌីយ៉ូ​យោង​ស្អាត​របស់​អ្នក​និយាយ​គោលដៅ​រយៈពេល ៣- ១០ វិនាទី & # 160; ។ CosyVoice2 ដក​លក្ខណៈ​ពិសេស​របស់​អ្នក​និយាយ​ដោយ​ប្រើ​វិធីសាស្ត្រ​កំណត់​ចំនួន​ខ្នាត​ដែល​មាន​កំណត់ បន្ទាប់​មក​បង្កើត​ការ​និយាយ​ថ្មី​ក្នុង​សំឡេង​ដែល​បាន​ក្លូន​នៅ​លើ​ភាសា​ដែល​បាន​គាំទ្រ​របស់​វា & # 160; ។ គ្មាន​ការ​បណ្តុះបណ្តាល​ម៉ូដែល ឬ​ការ​កំណត់​លម្អិត​ដែល​ត្រូវការ​ទេ & # 160; ។

CosyVoice2 គឺ​ជា​មួយ​នៃ​ម៉ូដែល​ក្លូន​ភាសា​ច្រើន​ដែល​ខ្លាំង​ជាង​គេ​មួយ​ដែល​រក្សា​អត្តសញ្ញាណ​អ្នក​និយាយ​ទោះ​បី​ជា​ពេល​បង្កើត​ការ​និយាយ​ក្នុង​ភាសា​ផ្សេង​ពី​វីដេអូ​យោង & # 160; ។ វា​ផលិត​ការ​និយាយ​ធម្មតា និង​ការ​និយាយ​ដែល​ធ្វើ​ឲ្យ​វា​សម​នឹង​ការ​បកប្រែ​ភាសា​ផ្សេង​គ្នា និង​មាតិកា​ដែល​បាន​កំណត់​ទីតាំង & # 160; ។

បាទ/ ចាស & # 160; ។ CosyVoice2 គឺ​ជា​គំរូ​លឿន និង​រួម​បញ្ចូល​របៀប​ស្ទ្រីម​ដែល​ផលិត​អូឌីយ៉ូ​ជាមួយ​នឹង​ការ​រង់ចាំ​ទាប ធ្វើ​ឲ្យ​វា​សមរម្យ​សម្រាប់​អ្នក​ជំនួយ​ការ​សំឡេង និង​កម្មវិធី​អន្តរកម្ម & # 160; ។ លើ TextToSpeechAI ជំនាន់​ជា​ធម្មតា​បញ្ចប់​ក្នុង​វិនាទី​សម្រាប់​អត្ថបទ​ខ្លី & # 160; ។

CosyVoice2 ត្រូវការ 4-6GB នៃ VRAM សម្រាប់ 0.5B ប៉ារ៉ាម៉ែត្រ គំរូ ដូច្នេះ GPU ជាមួយ 6GB ឬច្រើនជាងនេះត្រូវបានផ្ដល់អនុសាសន៍នៅពេល ខ្លួនឯង-ការ រៀបចំ ។ នៅលើ TextToSpeechAI គំរូរត់នៅលើហេដ្ឋារចនាសម្ព័ន្ធ GPU របស់យើង ដូច្នេះអ្នកមិនត្រូវការ ផ្នែក រឹង ណាមួយ របស់ ខ្លួន អ្នក ។

CosyVoice2 គឺជាម៉ូដែលកម្រិតខ្ពស់និងចំណាយ 25 ឥណទានក្នុងមួយ 1,000 តួអក្សរនៃអត្ថបទ. គណនីថ្មីទាំងអស់ទទួលបានឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃ, ដូច្នេះអ្នកអាចព្យាយាម CosyVoice2 ក្លូនសំឡេងមុនពេលសម្រេចចិត្តលើផែនការដែលបានបង់ប្រាក់.

ទាំង​ពីរ​គឺ​ជា​ម៉ាស៊ីន​ក្លូន​សំឡេង​ដែល​មាន​តម្លៃ​ខ្ពស់ & # 160; ។ GPT- Sovits ជា​ញឹកញាប់​ទៅ​ដល់​ភាព​ស្រដៀង​គ្នា​ដើម​ខ្ពស់​បំផុត​សម្រាប់​សំឡេង​គោលដៅ​តែ​មួយ ខណៈ​ពេល CosyVoice2 គឺ​រឹងមាំ​សម្រាប់​ភាសា​ច្រើន និង​ក្លូន​ភាសា​ឆ្លងកាត់ ហើយ​បន្ថែម​របៀប​ស្ទ្រីម​ទាប​លោត & # 160; ។ ជ្រើស CosyVoice2 ពេល​អ្នក​ត្រូវការ​សំឡេង​ក្លូន​មួយ​ដើម្បី​និយាយ​ភាសា​ច្រើន & # 160; ។

ទាំង​ពីរ​ផ្តល់​នូវ​គុណភាព​ខ្ពស់​ក្លែង​ធ្វើ​សំឡេង​សូន្យ​គ្រាប់​បាល់ ។ CosyVoice2គាំទ្រ​ភាសា​ច្រើន​ជាង (5 ប្រឆាំង​នឹង 2) និង​បន្ថែម​ស្ទ្រីម​សម្រាប់​ការ​ប្រើ​ពេល​ពិត ខណៈ​ពេល F5-TTS អាច​មាន​ល្បឿន​លឿន​បន្តិច​សម្រាប់​តែ​ការ​ផ្ទុក​ការងារ​ភាសា​អង់គ្លេស ។ សម្រាប់​គម្រោង​ភាសា​ច្រើន​ CosyVoice2 ជា​ធម្មតា​គឺ​សម​ល្អ​ជាង ។

TextToSpeechAI អនុញ្ញាត​ឲ្យ​អ្នក​នាំ​ចេញ​ជំនាន់ CosyVoice2 ក្នុង​ទ្រង់ទ្រាយ​ទូទៅ​ដូចជា MP3 និង WAV ។ អ្នក​អាច​ទាញ​យក​ឯកសារ​ដោយ​ផ្ទាល់​ពី​ទំព័រ​ប្រវត្តិ​របស់​អ្នក ឬ​ទាញ​យក​វា​ដោយ​កម្មវិធី​តាមរយៈ TextToSpeechAI API ។

បាទ. អ្នក អាច សាកល្បង CosyVoice2 ដោយ ប្រើ កម្មវិធី បង្ហាញ ឥត គិត ថ្លៃ និង ប្រាក់ រង្វាន់ ចាប់ផ្តើម ឥត គិត ថ្លៃ របស់ អ្នក នៅ លើ TextToSpeechAI ដោយ មិន ចាំបាច់ ដំឡើង អ្វី ទាំងអស់. គ្រាន់តែ ចុះឈ្មោះ, ផ្ទុក ឡើង វីដេអូ យោង ខ្លី, វាយ អត្ថបទ របស់ អ្នក ក្នុង ភាសា ណាមួយ ដែល គាំទ្រ និង បង្កើត.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try សំឡេង​ស្រស់​ស្អាត ២Name Now

Generate your first audio free. No credit card required.

Start Free