រចនាប័ទ្ម TTS ២

Ultra

អត្ថបទ​ទៅ​ការ​និយាយ​កម្រិត​មនុស្ស​ជាមួយ​ការ​ផ្ទេរ​រចនាប័ទ្ម

Moderate ល្បឿន​
Excellent គុណភាព
បាទ/ ចាស ក្លូន
1 ភាសា

អំពី រចនាប័ទ្ម TTS ២

s. StyleTTS 2 is the first TTS system to use the

លក្ខណៈ​ពិសេស​សំខាន់

គុណភាព​កម្រិត​មនុស្ស

បង្កើត​ការ​និយាយ​ដែល​មិន​អាច​បែងចែក​ពី​ការ​ថត​របស់​មនុស្ស​ក្នុង​ការ​សាកល្បង​មើល​មិន​ឃើញ & # 160; ។

ផ្ទេរ​រចនាប័ទ្ម

បញ្ជូន​រចនាប័ទ្ម​និយាយ​ពី​ឧទាហរណ៍​អូឌីយ៉ូ​យោង​ណាមួយ & # 160; ។

វណ្ណយុត្ត​ធម្មជាតិ

ភ្លេង​ល្អ​ឥតខ្ចោះ សម្ពាធ និង​ការ​និយាយ​ជាមួយ​ការ​បង្កើត​ម៉ូដែល​ដែល​មាន​មូលដ្ឋាន​លើ​ការ​បំភាយ & # 160; ។

ការ​ក្លូន​សំឡេង

ក្លូន​សំឡេង​ដោយ​ភាព​ត្រឹមត្រូវ និង​ភាព​ធម្មជាតិ​ដែល​មិន​ធម្មតា ។

ការ​សន្និដ្ឋាន​រហ័ស

រហ័ស​ជាង​ម៉ូដែល​ដែល​ត្រឡប់​ដោយ​ស្វ័យ​ប្រវត្តិ​ខណៈ​ពេល​រក្សា​គុណភាព & # 160; ។

ប្រភព​បើកចំហ

MIT អាជ្ញាប័ណ្ណ​ជាមួយ​នឹង​សិទ្ធិ​ប្រើ​ពាណិជ្ជកម្ម​ពេញលេញ & # 160; ។

ករណី​ប្រើ

សៀវភៅ​អូឌីយ៉ូ​ខ្ពស់ និយាយ​ជា​វិជ្ជាជីវៈ ការ​ផលិត​ភាពយន្ត និង​ទូរទស្សន៍ ការ​ផ្សាយ​ពាណិជ្ជកម្ម​ខ្ពស់ ការ​ផលិត​ផតខាស់ ការ​សម្ដែង​សំឡេង

រចនាប័ទ្ម TTS ២ Voices

View All 6
StyleTTS2 Default
EN
StyleTTS2 Expressive
EN
StyleTTS2 Fast
EN
StyleTTS2 Natural
EN
StyleTTS2 Neutral
EN
StyleTTS2 Quality
EN

របៀប​ប្រើ រចនាប័ទ្ម TTS ២

  1. 1

    ចុះឈ្មោះដោយឥតគិតថ្លៃ ឬរត់ការបង្ហាញ

    បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទទួលបានប្រាក់បញ្ញើចាប់ផ្តើមឬប្រើទំព័រដើមបង្ហាញដើម្បីស្តាប់ StyleTTS2ដោយគ្មានការចុះឈ្មោះ។

  2. 2

    ជ្រើស​ម៉ាស៊ីន StyleTTS2

    ជ្រើស​សំឡេង StyleTTS2 ពី​បណ្ណាល័យ​សំឡេង & # 160; ។ ដើម្បី​ក្លូន​សំឡេង ផ្ទុក​ឡើង​ចន្លោះ​ពេល​យោង ១០- ៣០ វិនាទី ហើយ StyleTTS2 នឹង​ផ្ទេរ​រចនាប័ទ្ម​របស់​វា & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​របស់​អ្នក

    បិទភ្ជាប់ ឬ​វាយ​ស្គ្រីប​ដែល​អ្នក​ចង់​និយាយ & # 160; ។ StyleTTS2 ល្អ​បំផុត​នៅ​ភាសា​អង់គ្លេស និង​ផ្ដល់​ការ​និយាយ​ធម្មតា អារម្មណ៍ និង​ការ​និយាយ​តាម​រយៈ​អត្ថបទ​វែង & # 160; ។

  4. 4

    បង្កើត​អូឌីយ៉ូ

    ចុចបង្កើតនិង TextToSpeechAI បង្ហាញសំឡេង StyleTTS2 របស់អ្នកនៅលើ GPU ។ កម្រិតខ្ពស់ StyleTTS2 ចំណាយ 50 ពិន្ទុក្នុងមួយ 1000 តួអក្សរ ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    ទាញយក StyleTTS2 បញ្ចប់ជា MP3, WAV, ឬ OGG អូឌីយ៉ូ, ឬហៅ TextToSpeechAI API ជាមួយ StyleTTS2 សំឡេងរបស់អ្នកដើម្បីបង្កើតស្វ័យប្រវត្តិ.

រចនាប័ទ្ម TTS ២ API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "StyleTTS2ផលិត​ការ​និយាយ​ដែល​ជា​ធម្មជាតិ វា​ប្រកួត​ប្រជែង​ការ​ថត​មនុស្ស​ជា​វិជ្ជាជីវៈ \u0026 # 160\u003B ។",
    "voice": "styletts2-default"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

StyleTTS2 គឺ​ជា​គំរូ​អត្ថបទ​ទៅ​ជា​ការ​និយាយ​ដែល​សម្រេច​បាន​ការ​សំយោគ​ការ​និយាយ​កម្រិត​មនុស្ស ។ វា​ប្រើ​ការ​បំភាយ​រចនាប័ទ្ម និង​ការ​បណ្តុះបណ្តាល​ប្រឆាំង​គ្នា​ដើម្បី​ផលិត​ការ​និយាយ​ដែល​មិន​អាច​ខុស​គ្នា​ពី​ការ​ថត​មនុស្ស​ពិត​ប្រាកដ​ក្នុង​ការ​សាកល្បង​ស្តាប់​មើល​មិន​ឃើញ ។ អ្នក​អាច​សាកល្បង StyleTTS2 ដោយ​ឥត​គិត​ថ្លៃ​នៅ​លើ TextToSpeechAI ។

StyleTTS2 ផលិត​សំឡេង​ TTS គុណភាព​ខ្ពស់​បំផុត​ដែល​អាច​រក​បាន​នៅ​លើ TextToSpeechAI ។ ក្នុង​ការ​វាយ​តម្លៃ​ជា​ផ្លូវការ​វា​បាន​ឈាន​ដល់​ការ​វាយ​តម្លៃ​កម្រិត​មនុស្ស​លើ​ការ​សាកល្បង​ម៉ូស (ពិន្ទុ​មធ្យម​យោបល់) ជាមួយ​អ្នក​ស្តាប់​ជា​ញឹកញាប់​មិន​អាច​បែង​ចែក​វា​ពី​អ្នក​និយាយ​មនុស្ស​ពិត ។ វា​អង្គុយ​នៅ​ក្នុង​ជួរ​អុីនធឺណិត​របស់យើង​នៅ​ក្បែរ​ឆ្កែ​ឆ្កួត​សម្រាប់​ហេតុផល​នោះ ។

បាទ StyleTTS2 គាំទ្រ​ការ​ក្លូន​សំឡេង​តាមរយៈ​ការ​ផ្ទេរ​រចនាប័ទ្ម & # 160; ។ វា​មិន​តែ​ស្រង់​ចេញ​តែ​សំឡេង​ប៉ុណ្ណោះ​ទេ ប៉ុន្តែ​ការ​និយាយ​លំនាំ​រោទិ៍ និង​គុណភាព​អារម្មណ៍​ពី​ចន្លោះ​យោង & # 160; ។ ផ្តល់​ឲ្យ 10- 30 វិនាទី​នៃ​អូឌីយ៉ូ​ច្បាស់​សម្រាប់​ក្លូន StyleTTS2 ត្រឹមត្រូវ​បំផុត & # 160; ។

បាទ/ ចាស ។ StyleTTS2 ត្រូវ​បាន​ចេញ​ផ្សាយ​ក្រោម​អាជ្ញាប័ណ្ណ MIT ដែល​អនុញ្ញាត​ឲ្យ​ប្រើ​ពាណិជ្ជកម្ម​ពេញលេញ​ដោយ​គ្មាន​ការ​បង់​ពន្ធ ។ វា​ធ្វើ​ឲ្យ​វា​មាន​សុវត្ថិភាព​សម្រាប់​សៀវភៅ​អូឌីយ៉ូ ការ​ផ្សាយ​ពាណិជ្ជកម្ម ភាពយន្ត និង​គម្រោង​ជំនាញ​ផ្សេង​ទៀត​របស់ StyleTTS2 ដែល​សិទ្ធិ​សំខាន់ ។

StyleTTS2 គាំទ្រ​ជា​ចម្បង​ភាសា​អង់គ្លេស ចាប់​តាំង​ពី​ម៉ូដែល​ត្រូវ​បាន​បណ្តុះ​បណ្តាល​លើ​សំណុំ​ទិន្នន័យ​ភាសា​អង់គ្លេស & # 160; ។ ប្រសិន​បើ​អ្នក​ត្រូវការ​គុណភាព​ស្រដៀង​គ្នា​នៅ​លើ​ភាសា​ច្រើន F5- TTS នៅ​លើ TextToSpeechAI គឺ​សម​ល្អ​ជាង​ខណៈ​ពេល​ដែល​នៅ​តែ​គាំទ្រ​ការ​ក្លូន​សំឡេង & # 160; ។

StyleTTS2 មានល្បឿនបង្កើតមធ្យម។ វាលឿនជាងម៉ូដែល autoregressive ដូចជា Tortoise ប៉ុន្តែយឺតជាងម៉ាស៊ីនស្រាលដូចជា Piper ។ ដោយសារតែគុណភាពខ្ពស់និងតម្លៃគណនា StyleTTS2 មានតម្លៃក្នុងកម្រិតអុីនធឺណិតរបស់យើងជំនួសឱ្យជាម៉ូដែលពេលវេលាពិត។

StyleTTS2 ត្រូវការប្រហែល 4-6GB នៃ VRAM សម្រាប់ ការ សន្និដ្ឋាន ។ វា មាន សមត្ថភាព ច្រើន ជាង Bark ឬ Tortoise ខណៈពេល ផលិត លទ្ធផល គុណភាព ខ្ពស់ ។ នៅលើ TextToSpeechAI ដំណើរការ StyleTTS2 ទាំងអស់ រត់ លើ GPUs របស់យើង ដូច្នេះ អ្នក មិន ត្រូវការ ផ្នែក រឹង ណាមួយ របស់ ខ្លួន អ្នក ផ្ទាល់ ។

StyleTTS2 គឺជាម៉ូដែលកម្រិតខ្ពស់និងចំណាយ 50 ពិន្ទុក្នុងមួយ 1000 តួអក្សរនៅលើ TextToSpeechAI. តម្លៃបន្ថែមនេះឆ្លុះបញ្ចាំងពីគុណភាពកម្រិតមនុស្សនិងធនធាន GPU ដែលត្រូវការ។ ម៉ូដែលស្តង់ដារដូចជា Piper ចំណាយ 10 ពិន្ទុក្នុងមួយ 1000 តួអក្សរដោយប្រៀបធៀប។

ជ្រើស StyleTTS2 ពេលគុណភាពអូឌីយ៉ូអង់គ្លេសដើមគឺជាអាទិភាពកំពូលហើយអ្នកចង់បានលទ្ធផលដែលលឺធម្មជាតិបំផុត។ ជ្រើស F5-TTS នៅពេលអ្នកត្រូវការការសំយោគភាសាច្រើនយ៉ាងលឿនជាមួយការក្លូនសំឡេង។ ទាំងពីរគាំទ្រការក្លូនប៉ុន្តែ StyleTTS2 គឺជាកម្រិតអតិបរមា (50 ក្រេឌីត) ខណៈពេលដែល F5-TTS គឺជាកម្រិត Premium (25 ក្រេឌីត) ។

StyleTTS2 បង្កើតសំឡេងគុណភាពខ្ពស់នៅ 24kHz ។ តាមរយៈ TextToSpeechAI អ្នកអាចទាញយកលទ្ធផលជា MP3, WAV, ឬ OGG ហើយយើងប្រើការអ៊ិនកូដគុណភាពខ្ពស់ដូច្នេះគុណភាព StyleTTS2 ពិសេសត្រូវបានរក្សាទុកនៅក្នុងឯកសារចុងក្រោយ។

បាទ/ ចាស ។ StyleTTS2 គាំទ្រ​ការ​លៃតម្រូវ​អត្រា​និយាយ ហើយ​រចនាប័ទ្ម​ផ្ទេរ​រចនាប័ទ្ម​របស់​វា​អនុញ្ញាត​ឲ្យ​អ្នក​បង្កើត​រូបរាង​របស់​អ្នក​ដោយ​ជ្រើស​ចន្លោះ​យោង​ផ្សេង​គ្នា ។ ការ​ជ្រើស​អូឌីយ៉ូ​ជាមួយ​នឹង​រង្វង់ និង​អារម្មណ៍​ដែល​អ្នក​ចង់​បាន​ផ្ដល់​ឲ្យ​អ្នក​នូវ​ការ​ត្រួតពិនិត្យ​ល្អ​ប្រសើរ​លើ​ការ​ផ្ដល់ StyleTTS2 ។

ជ្រើសសំឡេង StyleTTS2 ពីបណ្ណាល័យរបស់យើងឬផ្ទុកឡើងសំឡេងយោងដើម្បីបង្កើតសំឡេងក្លូនបន្ទាប់មកយោងទៅសំឡេងនោះនៅក្នុងសំណើ API របស់អ្នក។ TextToSpeechAI គ្រប់គ្រងដំណើរការ GPU ទាំងអស់ហើយត្រឡប់ URL ទាញយកជាមួយសំឡេង StyleTTS2 ប្រាក់រង្វាន់របស់អ្នក។

Technical Specs

  • Generation Speed Moderate
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 4-6GB
  • Credits/1000 chars 50

Try រចនាប័ទ្ម TTS ២ Now

Generate your first audio free. No credit card required.

Start Free