GPT- សូវីត

Premium

ការ​ក្លូន​សំឡេង​តិច​តួច​ជាមួយ​លទ្ធផល​គុណភាព​ខ្ពស់

Medium ល្បឿន​
Excellent គុណភាព
បាទ/ ចាស ក្លូន
5 ភាសា

អំពី GPT- សូវីត

-quality speech clones.

លក្ខណៈ​ពិសេស​សំខាន់

ការ​ក្លូន​សំឡេង​តិចតួច

ក្លូន​សំឡេង​ណាមួយ​ពី 3-10 វិនាទី​នៃ​អូឌីយ៉ូ​យោង​ជាមួយ​នឹង​ការ​បកប្រែ​សម្រាប់​គុណភាព​ល្អ​បំផុត ។

ការ​សំយោគ​ភាសា​ចម្រុះ

ហ្វឹកហាត់​លើ​ភាសា​មួយ និង​បង្កើត​ការ​និយាយ​ក្នុង​ភាសា​ចិន អង់គ្លេស ជប៉ុន កូរ៉េ ឬ​កាតុង ។

គុណភាព​ខ្ពស់​បំផុត

GPT-SoVITS តែងតែឈរក្នុងចំណោមម៉ូដែលក្លូនសំឡេងដែលមានគុណភាពខ្ពស់បំផុត។

ប្រភព​បើកចំហ

អាជ្ញាប័ណ្ណ MIT ពេញលេញ​ជាមួយ​ការ​អភិវឌ្ឍ​សហគមន៍​សកម្ម និង​ឯកសារ​ទូលំទូលាយ ។

ករណី​ប្រើ

ការ​ក្លូន​សំឡេង​ជា​អ្នក​ជំនាញ ការ​បកប្រែ​ភាសា​ផ្សេងគ្នា និង​ការ​កំណត់​ទីតាំង ការ​ផលិត​សៀវភៅ​អូឌីយ៉ូ ការ​រចនា​សំឡេង​តួអក្សរ

របៀប​ប្រើ GPT- សូវីត

  1. 1

    បង្កើត​គណនី​ឥត​គិត​ថ្លៃ ឬ​បើក​ការ​សាកល្បង

    ចុះឈ្មោះសម្រាប់ TextToSpeechAI ដើម្បីទទួលយកឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃឬលោតទៅក្នុងគំរូដើម្បីព្យាយាម GPT-SoVITS ដោយគ្មានការចុះឈ្មោះដែលត្រូវការ។

  2. 2

    ជ្រើស GPT-SoVITS និង​ផ្ទុក​ឡើង​វីដេអូ​យោង

    ជ្រើស GPT-SoVITS ជា​ម៉ាស៊ីន​របស់​អ្នក បន្ទាប់​មក​ផ្ទុក​ឡើង​នូវ​វីដេអូ​យោង​វិនាទី 3-10 នៃ​សំឡេង​ដែល​អ្នក​ចង់​ក្លូន ។ ការ​បន្ថែម​អត្ថបទ​នៃ​វីដេអូ​នោះ​ផ្តល់​នូវ​ក្លូន​ដែល​ស្អាត​បំផុត និង​ត្រឹមត្រូវ​បំផុត ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក

    វាយ ឬ​បិទភ្ជាប់​អត្ថបទ​ដែល​អ្នក​ចង់​និយាយ​ក្នុង​សំឡេង​ដែល​បាន​ក្លូន & # 160; ។ GPT- Sovits គាំទ្រ​ភាសា​ចិន អង់គ្លេស ជប៉ុន កូរ៉េ និង​កាតុង រួម​ទាំង​ក្លូន​ភាសា​ពី​ការ​យោង​ក្នុង​ភាសា​ផ្សេង​ទៀត & # 160; ។

  4. 4

    បង្កើត​អូឌីយ៉ូ

    ចុចបង្កើតដើម្បីផ្ញើការងារទៅម៉ាស៊ីនបម្រើ GPU របស់យើង។ GPT-SoVITS បង្ហាញការនិយាយក្លូនដែលមានគុណភាពល្អនៅល្បឿនមធ្យមជាមួយ 25 ពិន្ទុដែលគិតថ្លៃក្នុងមួយ 1,000 តួអក្សរ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    ទាញយកសំឡេង GPT-SoVITS បញ្ចប់របស់អ្នកជាឯកសារមួយ, ឬបង្កើតដោយស្វ័យប្រវត្តិតាមរយៈ TextToSpeechAI REST API នៅ api.texttospeechai.com សម្រាប់លំហូរការងារផលិតកម្ម.

GPT- សូវីត API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "GPT\u002DSoVITS ផលិត​ការ​ក្លូន​សំឡេង​គុណភាព​ខ្ពស់​បំផុត​ពី​អូឌីយ៉ូ​តែ​ពីរបី​វិនាទី​ប៉ុណ្ណោះ ។",
    "voice": "en_US-lessac-medium"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

GPT-SoVITS គឺ​ជា​ប្រព័ន្ធ​ក្លូន​សំឡេង​ដែល​រួម​បញ្ចូល​គ្នា​នូវ​ការ​រចនា​ម៉ូដ​ភាសា​បែប GPT ជាមួយ​នឹង​ការ​បម្លែង​សំឡេង SoVITS ។ វា​ផលិត​ក្លូន​សំឡេង​ធម្មជាតិ​គួរ​ឱ្យ​កត់សម្គាល់​ពី​តែ 3-10 វិនាទី​នៃ​អូឌីយ៉ូ​យោង ។

បាទ GPT-SoVITS គឺ​ជា​អាជ្ញាប័ណ្ណ MIT ពេញលេញ - ទាំង​កូដ និង​ទំងន់​ម៉ូដែល & # 160; ។ វា​អាច​ប្រើ​ដោយ​សេរី​ក្នុង​កម្មវិធី​ពាណិជ្ជកម្ម​ដោយ​គ្មាន​ការ​កំណត់ & # 160; ។

GPT-SoVITS គាំទ្រ​ភាសា​ចិន អង់គ្លេស ជប៉ុន កូរ៉េ និង​កាតុង ។ វា​ក៏​គាំទ្រ​ការ​ក្លូន​សំឡេង​ភាសា​ផ្សេង​គ្នា​ដែរ - ផ្តល់​សេចក្ដី​យោង​ក្នុង​ភាសា​មួយ និង​បង្កើត​ការ​និយាយ​ក្នុង​ភាសា​ផ្សេង​ទៀត ។

GPT-SoVITS តែងតែ​ស្ថិត​ក្នុង​ចំណោម​ម៉ូដែល​ក្លូន​សំឡេង​ដែលមាន​គុណភាព​ខ្ពស់​បំផុត ។ វា​ផលិត​ការ​និយាយ​ធម្មជាតិ​ជាង​ជម្រើស​ច្រើន​បំផុត​ជា​ពិសេស​នៅពេល​ដែល​បាន​ផ្ដល់​នូវ​អត្ថបទ​អូឌីយ៉ូ​យោង ។

សម្រាប់​លទ្ធផល​ល្អ​បំផុត ផ្ដល់​ទាំង​ចន្លោះ​អូឌីយ៉ូ​យោង និង​អត្ថបទ​ដែល​បាន​សរសេរ​ឡើងវិញ​របស់​វា & # 160; ។ អត្ថបទ​ដែល​បាន​សរសេរ​ឡើងវិញ​ជួយ​ម៉ូដែល​យល់​ពី​លក្ខណៈ​ពិសេស​សំឡេង​យោង​បាន​ល្អ & # 160; ។ ដោយ​គ្មាន​អត្ថបទ​ដែល​បាន​សរសេរ​ឡើងវិញ ម៉ូដែល​នៅតែ​ធ្វើការ ប៉ុន្តែ​គុណភាព​អាច​ទាប​បន្តិច & # 160; ។

GPT-SoVITS ត្រូវការ 4-8GB នៃ VRAM អាស្រ័យលើប្រវែងបញ្ចូល។ GPU ដែលមាន 6GB ឬច្រើនជាងនេះត្រូវបានផ្ដល់អនុសាសន៍សម្រាប់ដំណើរការល្អបំផុត។ នៅលើ TextToSpeechAI ម៉ូដែលរត់នៅលើម៉ាស៊ីនបម្រើ GPU របស់យើងដូច្នេះអ្នកមិនត្រូវការផ្នែករឹងណាមួយឡើយ។

GPT-SoVITS ផ្ដល់​នូវ​ការ​ក្លូន​សំឡេង​ពិត​ប្រាកដ​បំផុត​ដែល​អាច​ប្រើ​បាន​ខ្លះ​ដែល​បាន​បង្កើត​ឡើងវិញ​ដោយ​ស្មោះត្រង់​ពី​ចង្វាក់​សំឡេង​សំឡេង​និង​សំឡេង​ពី​វីដេអូ​យោង​ខ្លី ។ ការ​ផ្ដល់​នូវ​អត្ថបទ​នៃ​អូឌីយ៉ូ​យោង​ជំរុញ​គុណភាព​ខ្ពស់​ជាង​មុន​ទៀត​ដែល​ធ្វើ​ឲ្យ​ក្លូន​ស្ទើរ​តែ​មិន​អាច​បែងចែក​ពី​អ្នក​និយាយ​ប្រភព ។

GPT-SoVITS ត្រូវការតែ 3-10 វិនាទីនៃអូឌីយ៉ូយោងស្អាតដើម្បីក្លូនសំឡេង។ គំរូខ្លីច្បាស់លាស់ដែលមានសំឡេងផ្ទៃខាងក្រោយតិចតួចផ្តល់លទ្ធផលល្អបំផុតហើយបន្ថែមការផ្គូផ្គងការសរសេរឡើងវិញបង្កើនភាពត្រឹមត្រូវបន្ថែមទៀត។

GPT- SoVITS រត់​នៅ​ល្បឿន​មធ្យម និង​ផលិត​លទ្ធផល​គុណភាព​ល្អ​ប្រសើរ​នៅ​ជិត​ស្ទូឌីយោ & # 160; ។ វា​ធ្វើ​ពាណិជ្ជកម្ម​ល្បឿន​តិចតួច​បើ​ធៀប​នឹង​ម៉ូដែល​ស្រាល​ដូច Piper ឬ Kokoro ក្នុង​ការ​ផ្លាស់ប្តូរ​សម្រាប់​ការ​និយាយ​ក្លូន​ដែល​មាន​លក្ខណៈ​ធម្មជាតិ​ច្រើន​ជាង​មុន & # 160; ។

GPT-SoVITS គឺជាម៉ូដែលកម្រិតខ្ពស់ដែលមានតម្លៃ 25 ពិន្ទុក្នុងមួយតួអក្សរ 1,000 ។ វាស្ថិតនៅខាងលើកម្រិតស្តង់ដារ (ពិន្ទុ 10) ប៉ុន្តែនៅក្រោមម៉ូដែលកម្រិតខ្ពស់ដូចជា Tortoise និង StyleTTS2 (ពិន្ទុ 50) ។

ទាំងពីរគឺម៉ាស៊ីនក្លូនសំឡេងកម្រិតខ្ពស់ដែលអនុញ្ញាតឱ្យប្រើពាណិជ្ជកម្ម។ GPT-SoVITS មានទំនោរឈ្នះលើភាពស្មោះត្រង់នៃការក្លូនដើមនិង prosody ភាសាបរទេសខណៈពេលដែល CosyVoice2(Apache 2.0) ផ្តល់ជូននូវការគ្របដណ្តប់ភាសាច្រើន។ ព្យាយាមដោយឥតគិតថ្លៃនៅលើ TextToSpeechAI និងជ្រើសមួយដែលសមនឹងសំឡេងគោលដៅរបស់អ្នក។

បាទ. ចុះឈ្មោះសម្រាប់គណនីឥតគិតថ្លៃ TextToSpeechAI ដើម្បីទទួលបានប្រាក់រង្វាន់ចាប់ផ្តើមម្តងឬប្រើការបង្ហាញដើម្បីស្តាប់ GPT-SoVITS ដោយគ្មានគណនី។ នោះគឺគ្រប់គ្រាន់ដើម្បីក្លូនសំឡេងនិងសាកល្បងគុណភាពមុនពេលទិញកញ្ចប់ប្រាក់រង្វាន់។

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try GPT- សូវីត Now

Generate your first audio free. No credit card required.

Start Free