ថ្ងៃ
UltraTTS ដែលមានទិសដៅប្រអប់ជាមួយការក្លូនសំឡេង និងសំឡេងមិននិយាយ
អំពី ថ្ងៃ
ing the most accurate text-to-speech results for the most diverse audiences. Dia is the first text-to-speech model to use the 1.6B parameter, and is the first text-to-speech model to use the 1.6B parameter for the most diverse audiences. Dia is the first text-to-speech model to use the 1.6B parameter, and is the first text-to-speech model to use the 1.6B parameter
លក្ខណៈពិសេសសំខាន់
ការបង្កើតប្រអប់
បង្កើតការសន្ទនាអ្នកនិយាយច្រើនដោយមានសំឡេងខុសៗគ្នា និងការចាប់ផ្ដើមជុំ ។
សំឡេងមិននិយាយ
បន្ថែម [លាន់មាត់], [សើច], [ហៀរសំបោរ], (gasps) សម្រាប់ប្រសាសន៍ paralinguistic ធម្មជាតិ & # 160; ។
ការក្លូនសំឡេង
ក្លូនសំឡេងណាមួយពី 5-10 វិនាទីនៃអូឌីយ៉ូយោងសម្រាប់ការនិយាយផ្ទាល់ខ្លួន ។
ការសន្ទនាធម្មតា
ប៉ារ៉ាម៉ែត្រ 1.6B ផលិតការនិយាយធម្មជាតិខ្ពស់ prosody និង intonation ។
ករណីប្រើ
របៀបប្រើ ថ្ងៃ
-
1
ចុះឈ្មោះដោយឥតគិតថ្លៃឬបើកការសាកល្បង
បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទាមទារប្រាក់រង្វាន់ចាប់ផ្តើមរបស់អ្នកឬបើកការបង្ហាញមិនចុះឈ្មោះដើម្បីសាកល្បងប្រអប់ Dia ភ្លាមៗ។
-
2
ជ្រើសម៉ាស៊ីន Dia
ក្នុងបន្ទះឧបករណ៍ TTS ជ្រើស Dia ពីបញ្ជីម៉ាស៊ីន & # 160; ។ Dia គឺជាការឆ្លើយតបដែលមានទិសដៅ ម៉ូដែលកម្រិតខ្ពស់ដែលមានអ្នកនិយាយច្រើន និងការគាំទ្រក្លូនសំឡេង & # 160; ។
-
3
សរសេរស្គ្រីបប្រអប់ជាមួយស្លាក
បង្កើតការសន្ទនារបស់អ្នកដោយប្រើ [S1] និង [S2] ដើម្បីសម្គាល់ការប្ដូរអ្នកនិយាយនីមួយៗ និងទម្លាក់ស្លាកមិននិយាយដូចជា [laughs], [sighs], [coughs], ឬ (gasps) នៅកន្លែងដែលអ្នកចង់មានប្រតិកម្មធម្មជាតិ & # 160; ។
-
4
បង្កើតអូឌីយ៉ូ
ចុចបង្កើត ដើម្បីផ្ញើស្គ្រីប Dia របស់អ្នកទៅ GPU ដែលបានរៀបចំរបស់យើង & # 160; ។ Dia បង្ហាញប្រអប់អ្នកនិយាយពីរជាមួយការចាប់ផ្ដើមជុំ និងស្លាកមិននិយាយរបស់អ្នកទៅក្នុងឯកសារអូឌីយ៉ូតែមួយ & # 160; ។
-
5
ទាញយក ឬហៅ API
ទាញយកប្រអប់បញ្ចប់នៅក្នុងទ្រង់ទ្រាយដែលអ្នកបានជ្រើស, ឬស្វ័យប្រវត្តិវាដោយការបង្ហោះស្គ្រីបដូចគ្នា [S1] / [S2] ទៅ TextToSpeechAI API ជាមួយតួអក្សរគណនីរបស់អ្នក.
ថ្ងៃ API
បង្កើតការនិយាយដោយប្រើកម្មវិធីដោយប្រើ TextToSpeechAI REST API ។
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] ជំរាបសួរ! តើអ្នកនៅថ្ងៃនេះយ៉ាងម៉េច? [ខឹង] [S2] ខ្ញុំកំពុងធ្វើល្អ, សូមអរគុណសម្រាប់ការសួរ!",
"voice": "en_US-lessac-medium"
}'
សំណួរដែលសួរញឹកញាប់
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50