សំឡេងស្រស់ស្អាត ២Name
Premiumការក្លូនសំឡេងច្រើនភាសា Zero-shot ដែលគាំទ្រស្ទ្រីម
អំពី សំឡេងស្រស់ស្អាត ២Name
[Translation temporarily unavailable. Please try again.]
លក្ខណៈពិសេសសំខាន់
ការក្លូនសំឡេង Zero- Shot
ក្លូនសំឡេងណាមួយពី 3-10 វិនាទីនៃអូឌីយ៉ូយោងជាមួយភាពត្រឹមត្រូវខ្ពស់ ។
ភាសាច្រើន
គាំទ្រភាសាចិន អង់គ្លេស ជប៉ុន កូរ៉េ និងកាតុងជាមួយការសំយោគភាសាឆ្លង ។
ការគាំទ្រស្ទ្រីម
របៀបស្ទ្រីមអត្រាលោតទាបសម្រាប់កម្មវិធីពេលពិត និងប្រព័ន្ធអន្តរកម្ម & # 160; ។
វណ្ណយុត្តធម្មជាតិ
ការបង្កើតម៉ូដែលប្រូសូឌីកម្រិតខ្ពស់បង្កើតការនិយាយដែលមានសំឡេងធម្មជាតិជាមួយនឹងការអោនសមរម្យ & # 160; ។
ករណីប្រើ
របៀបប្រើ សំឡេងស្រស់ស្អាត ២Name
-
1
ចុះឈ្មោះនិងទាមទារឥណទានឥតគិតថ្លៃ
បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទាមទារប្រាក់រង្វាន់ចាប់ផ្តើមរបស់អ្នកឬព្យាយាមបង្ហាញដំបូង. គ្មាន GPU ឬការដំឡើង CosyVoice2 មូលដ្ឋានគឺត្រូវការ - គ្រប់យ៉ាងរត់នៅលើហេដ្ឋារចនាសម្ព័ន្ធរបស់យើង.
-
2
ជ្រើស CosyVoice2 ហើយបន្ថែមចាក់វីដេអូយោង
ជ្រើស CosyVoice2 ជាម៉ាស៊ីនរបស់អ្នក បន្ទាប់មកផ្ទុកការថតយោងស្អាត 3- 10 វិនាទីនៃសំឡេងដែលអ្នកចង់ក្លូន & # 160; ។ CosyVoice2 នឹងស្រង់លក្ខណៈពិសេសរបស់អ្នកនិយាយសម្រាប់ក្លូនភាសាច្រើនដែលមិនបានចាក់ & # 160; ។
-
3
បញ្ចូលអត្ថបទរបស់អ្នកក្នុងភាសាដែលបានគាំទ្រណាមួយ
វាយ ឬបិទភ្ជាប់ស្គ្រីបរបស់អ្នកជាភាសាចិន អង់គ្លេស ជប៉ុន កូរ៉េ ឬកាតុង ។ CosyVoice2គាំទ្រការបង្កើតភាសាឆ្លងកាត់ ដូច្នេះសំឡេងដែលបានក្លូនអាចនិយាយភាសាផ្សេងពីចន្លោះយោង ។
-
4
បង្កើតការនិយាយ
ចុចបង្កើតនិង CosyVoice2 សំយោគធម្មជាតិ, និយាយភាសាច្រើននៅក្នុងសំឡេងក្លូន, ជាធម្មតាក្នុងរយៈពេលពីរវិនាទីសម្រាប់អត្ថបទខ្លី. ការប្រើប្រាស់កម្រិតខ្ពស់ចំណាយ 25 ឥណទានក្នុងមួយ 1,000 តួអក្សរ.
-
5
ទាញយក ឬប្រើ API
ទាញយកអូឌីយ៉ូដែលបានបញ្ចប់ជា MP3 ឬ WAV ពីប្រវត្តិរបស់អ្នកឬធ្វើស្វ័យប្រវត្តិ CosyVoice2 ក្លូនសំឡេងនៅទំហំតាមរយៈ TextToSpeechAI REST API ។
សំឡេងស្រស់ស្អាត ២Name API
បង្កើតការនិយាយដោយប្រើកម្មវិធីដោយប្រើ TextToSpeechAI REST API ។
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 ផ្ដល់ការនិយាយជាភាសាច្រើនដោយមានសមត្ថភាពក្លូនសំឡេងសូន្យគ្រាប់។",
"voice": "en_US-lessac-medium"
}'
សំណួរដែលសួរញឹកញាប់
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25