រចនាប័ទ្ម TTS ២
Ultraអត្ថបទទៅការនិយាយកម្រិតមនុស្សជាមួយការផ្ទេររចនាប័ទ្ម
អំពី រចនាប័ទ្ម TTS ២
s. StyleTTS 2 is the first TTS system to use the
លក្ខណៈពិសេសសំខាន់
គុណភាពកម្រិតមនុស្ស
បង្កើតការនិយាយដែលមិនអាចបែងចែកពីការថតរបស់មនុស្សក្នុងការសាកល្បងមើលមិនឃើញ & # 160; ។
ផ្ទេររចនាប័ទ្ម
បញ្ជូនរចនាប័ទ្មនិយាយពីឧទាហរណ៍អូឌីយ៉ូយោងណាមួយ & # 160; ។
វណ្ណយុត្តធម្មជាតិ
ភ្លេងល្អឥតខ្ចោះ សម្ពាធ និងការនិយាយជាមួយការបង្កើតម៉ូដែលដែលមានមូលដ្ឋានលើការបំភាយ & # 160; ។
ការក្លូនសំឡេង
ក្លូនសំឡេងដោយភាពត្រឹមត្រូវ និងភាពធម្មជាតិដែលមិនធម្មតា ។
ការសន្និដ្ឋានរហ័ស
រហ័សជាងម៉ូដែលដែលត្រឡប់ដោយស្វ័យប្រវត្តិខណៈពេលរក្សាគុណភាព & # 160; ។
ប្រភពបើកចំហ
MIT អាជ្ញាប័ណ្ណជាមួយនឹងសិទ្ធិប្រើពាណិជ្ជកម្មពេញលេញ & # 160; ។
ករណីប្រើ
រចនាប័ទ្ម TTS ២ Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENរបៀបប្រើ រចនាប័ទ្ម TTS ២
-
1
ចុះឈ្មោះដោយឥតគិតថ្លៃ ឬរត់ការបង្ហាញ
បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទទួលបានប្រាក់បញ្ញើចាប់ផ្តើមឬប្រើទំព័រដើមបង្ហាញដើម្បីស្តាប់ StyleTTS2ដោយគ្មានការចុះឈ្មោះ។
-
2
ជ្រើសម៉ាស៊ីន StyleTTS2
ជ្រើសសំឡេង StyleTTS2 ពីបណ្ណាល័យសំឡេង & # 160; ។ ដើម្បីក្លូនសំឡេង ផ្ទុកឡើងចន្លោះពេលយោង ១០- ៣០ វិនាទី ហើយ StyleTTS2 នឹងផ្ទេររចនាប័ទ្មរបស់វា & # 160; ។
-
3
បញ្ចូលអត្ថបទរបស់អ្នក
បិទភ្ជាប់ ឬវាយស្គ្រីបដែលអ្នកចង់និយាយ & # 160; ។ StyleTTS2 ល្អបំផុតនៅភាសាអង់គ្លេស និងផ្ដល់ការនិយាយធម្មតា អារម្មណ៍ និងការនិយាយតាមរយៈអត្ថបទវែង & # 160; ។
-
4
បង្កើតអូឌីយ៉ូ
ចុចបង្កើតនិង TextToSpeechAI បង្ហាញសំឡេង StyleTTS2 របស់អ្នកនៅលើ GPU ។ កម្រិតខ្ពស់ StyleTTS2 ចំណាយ 50 ពិន្ទុក្នុងមួយ 1000 តួអក្សរ ។
-
5
ទាញយក ឬប្រើ API
ទាញយក StyleTTS2 បញ្ចប់ជា MP3, WAV, ឬ OGG អូឌីយ៉ូ, ឬហៅ TextToSpeechAI API ជាមួយ StyleTTS2 សំឡេងរបស់អ្នកដើម្បីបង្កើតស្វ័យប្រវត្តិ.
រចនាប័ទ្ម TTS ២ API
បង្កើតការនិយាយដោយប្រើកម្មវិធីដោយប្រើ TextToSpeechAI REST API ។
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS2ផលិតការនិយាយដែលជាធម្មជាតិ វាប្រកួតប្រជែងការថតមនុស្សជាវិជ្ជាជីវៈ \u0026 # 160\u003B ។",
"voice": "styletts2-default"
}'
សំណួរដែលសួរញឹកញាប់
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50