ថ្ងៃ

Ultra

TTS ដែលមានទិសដៅប្រអប់ជាមួយការក្លូនសំឡេង និងសំឡេងមិននិយាយ

Medium ល្បឿន

Excellent គុណភាព

បាទ/ ចាស ក្លូន

1 ភាសា

អំពី ថ្ងៃ

ing the most accurate text-to-speech results for the most diverse audiences. Dia is the first text-to-speech model to use the 1.6B parameter, and is the first text-to-speech model to use the 1.6B parameter for the most diverse audiences. Dia is the first text-to-speech model to use the 1.6B parameter, and is the first text-to-speech model to use the 1.6B parameter

លក្ខណៈពិសេសសំខាន់

ការបង្កើតប្រអប់

បង្កើតការសន្ទនាអ្នកនិយាយច្រើនដោយមានសំឡេងខុសៗគ្នា និងការចាប់ផ្ដើមជុំ ។

សំឡេងមិននិយាយ

បន្ថែម [លាន់មាត់], [សើច], [ហៀរសំបោរ], (gasps) សម្រាប់ប្រសាសន៍ paralinguistic ធម្មជាតិ & # 160; ។

ការក្លូនសំឡេង

ក្លូនសំឡេងណាមួយពី 5-10 វិនាទីនៃអូឌីយ៉ូយោងសម្រាប់ការនិយាយផ្ទាល់ខ្លួន ។

ការសន្ទនាធម្មតា

ប៉ារ៉ាម៉ែត្រ 1.6B ផលិតការនិយាយធម្មជាតិខ្ពស់ prosody និង intonation ។

ករណីប្រើ

ការបង្កើតប្រអប់ និងការសន្ទនា ការផលិតសៀវភៅអូឌីយ៉ូជាមួយតួអក្សរច្រើន សំឡេងតួអក្សរល្បែង ផតខាស់ និងការបង្កើតមាតិកា

របៀបប្រើ ថ្ងៃ

1

ចុះឈ្មោះដោយឥតគិតថ្លៃឬបើកការសាកល្បង

បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទាមទារប្រាក់រង្វាន់ចាប់ផ្តើមរបស់អ្នកឬបើកការបង្ហាញមិនចុះឈ្មោះដើម្បីសាកល្បងប្រអប់ Dia ភ្លាមៗ។
2

ជ្រើសម៉ាស៊ីន Dia

ក្នុងបន្ទះឧបករណ៍ TTS ជ្រើស Dia ពីបញ្ជីម៉ាស៊ីន & # 160; ។ Dia គឺជាការឆ្លើយតបដែលមានទិសដៅ ម៉ូដែលកម្រិតខ្ពស់ដែលមានអ្នកនិយាយច្រើន និងការគាំទ្រក្លូនសំឡេង & # 160; ។
3

សរសេរស្គ្រីបប្រអប់ជាមួយស្លាក

បង្កើតការសន្ទនារបស់អ្នកដោយប្រើ [S1] និង [S2] ដើម្បីសម្គាល់ការប្ដូរអ្នកនិយាយនីមួយៗ និងទម្លាក់ស្លាកមិននិយាយដូចជា [laughs], [sighs], [coughs], ឬ (gasps) នៅកន្លែងដែលអ្នកចង់មានប្រតិកម្មធម្មជាតិ & # 160; ។
4

បង្កើតអូឌីយ៉ូ

ចុចបង្កើត ដើម្បីផ្ញើស្គ្រីប Dia របស់អ្នកទៅ GPU ដែលបានរៀបចំរបស់យើង & # 160; ។ Dia បង្ហាញប្រអប់អ្នកនិយាយពីរជាមួយការចាប់ផ្ដើមជុំ និងស្លាកមិននិយាយរបស់អ្នកទៅក្នុងឯកសារអូឌីយ៉ូតែមួយ & # 160; ។
5

ទាញយក ឬហៅ API

ទាញយកប្រអប់បញ្ចប់នៅក្នុងទ្រង់ទ្រាយដែលអ្នកបានជ្រើស, ឬស្វ័យប្រវត្តិវាដោយការបង្ហោះស្គ្រីបដូចគ្នា [S1] / [S2] ទៅ TextToSpeechAI API ជាមួយតួអក្សរគណនីរបស់អ្នក.

ថ្ងៃ API

បង្កើតការនិយាយដោយប្រើកម្មវិធីដោយប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] ជំរាបសួរ! តើអ្នកនៅថ្ងៃនេះយ៉ាងម៉េច? [ខឹង] [S2] ខ្ញុំកំពុងធ្វើល្អ, សូមអរគុណសម្រាប់ការសួរ!",
    "voice": "en_US-lessac-medium"
  }'

អានឯកសារ API យកកូនសោ API របស់អ្នក

សំណួរដែលសួរញឹកញាប់

Dia គឺជាម៉ូដែលអត្ថបទទៅជាសំឡេងដែលមានប៉ារ៉ាម៉ែត្រ 1.6B ដែលមានទិសដៅប្រអប់ពី Nari Labs ។ វាមានជំនាញក្នុងការបង្កើតការនិយាយធម្មតាដែលមានការគាំទ្រសម្រាប់អ្នកនិយាយច្រើន សំឡេងមិននិយាយ និងការក្លូនសំឡេង ។

បាទ Dia គឺជាអាជ្ញាប័ណ្ណ Apache 2.0ពេញលេញ - ទាំងកូដ និងទំងន់ម៉ូដែល & # 160; ។ វាអាចប្រើដោយសេរីក្នុងកម្មវិធីពាណិជ្ជកម្ម & # 160; ។

បច្ចុប្បន្ន Dia គាំទ្រតែភាសាអង់គ្លេសប៉ុណ្ណោះ & # 160; ។ ម៉ូដែលត្រូវបានធ្វើឲ្យប្រសើរសម្រាប់ការនិយាយភាសាអង់គ្លេសធម្មតា & # 160; ។

Dia ត្រូវការប្រហែល 10GB នៃ VRAM សម្រាប់ម៉ូដែលប៉ារ៉ាម៉ែត្រ 1.6B របស់វា។ GPU ដែលមានយ៉ាងហោចណាស់ 12GB ត្រូវបានផ្ដល់អនុសាសន៍សម្រាប់ប្រតិបត្តិការងាយស្រួល។ នៅលើ TextToSpeechAI ទាំងអស់នេះរត់នៅលើ GPUs ដែលយើងបាន hosted ដូច្នេះអ្នកមិនត្រូវការផ្នែករឹងណាមួយរបស់ខ្លួនឯងទេ។

បាទ - ប្រអប់គឺជាអ្វីដែល Dia ត្រូវបានបង្កើតសម្រាប់ & # 160; ។ ដោយផ្លាស់ប្ដូរ [S1] និង [S2] ជុំក្នុងស្គ្រីបរបស់អ្នក Dia TTS ផលិតការសន្ទនាអ្នកនិយាយពីរដែលហូរដោយមានសំឡេងខុសៗគ្នា និងការធ្វើជុំពិតប្រាកដ ដែលពិបាកក្នុងការសម្រេចបានជាមួយម៉ូដែល TTS អ្នកនិយាយតែមួយ & # 160; ។

បញ្ចូលបុព្វបទបន្ទាត់នីមួយៗនៃស្គ្រីបរបស់អ្នកជាមួយ [S1] ឬ [S2] ដើម្បីសម្គាល់ថាអ្នកកំពុងនិយាយ & # 160; ។ Dia ផ្ដល់សំឡេងដែលមិនប្រែប្រួលទៅស្លាកនីមួយៗ ហើយប្ដូររវាងពួកវាដូចការផ្លាស់ទីការសន្ទនា ដូច្នេះ [S1] និង [S2] ធ្វើជាតួអក្សរពីរក្នុងប្រអប់របស់អ្នក & # 160; ។

បាទ/ ចាស & # 160; ។ Dia គាំទ្រការក្លូនសំឡេងពីប្រហែល ៥- ១០ វិនាទីនៃសំឡេងយោងស្អាត អនុញ្ញាតឲ្យអ្នកប្រើសំឡេងជាក់លាក់សម្រាប់អ្នកនិយាយម្ដងទៀត & # 160; ។ អ្នកអាចរួមបញ្ចូលការក្លូនជាមួយស្លាក [S1] / [S2] ដូច្នេះតួអក្សរនីមួយៗក្នុងប្រអប់មានសំឡេងដូចសំឡេងដែលអ្នកក្លូន & # 160; ។

Dia បង្ហាញ [ញញឹម] [យំ] [ហៀរសំបោរ] និង (ហៀរសំបោរ) ជាសំឡេងធម្មជាតិដែលបានដេរចូលក្នុងការនិយាយជំនួសឲ្យពាក្យដែលនិយាយ & # 160; ។ ដាក់ស្លាកនៅកន្លែងដែលអ្នកចង់ឲ្យមានប្រតិកម្ម - ឧទាហរណ៍ "[S1] That is hilarious [laughs]" - ដើម្បីធ្វើឲ្យប្រអប់មានអារម្មណ៍មនុស្សច្រើនជាង & # 160; ។

ទាំង Dia និង Bark គាំទ្រសំឡេងមិននិយាយដែលបង្ហាញ ប៉ុន្តែ Dia ត្រូវបានបង្កើតសម្រាប់គោលបំណងសម្រាប់ប្រអប់អ្នកនិយាយច្រើនជាមួយ [S1] / [S2] ពេលដើរនិងក្លូនសំឡេង & # 160; ។ ជ្រើស Dia សម្រាប់ការសន្ទនាមនុស្សពីរនាក់ពិតប្រាកដ និងការងារតួអក្សរ & # 160; ។ Bark គឺសមល្អជាងពេលអ្នកត្រូវការការគ្របដណ្តប់ភាសាទូលំទូលាយក្នុងការនិយាយសំឡេងតែមួយ & # 160; ។

Dia គឺជាម៉ាស៊ីនកម្រិតខ្ពស់ដូច្នេះវាចំណាយពេល 50 ពិន្ទុក្នុងមួយ 1,000 តួអក្សរនៃការនិយាយដែលបានបង្កើតឡើង។ កម្រិតខ្ពស់ឆ្លុះបញ្ចាំងពីម៉ូដែលធំជាង 1.6B និង ~10GB នៃសតិ GPU ដែលវាប្រើសម្រាប់ការសន្ទនាដែលមានគុណភាពខ្ពស់។

បាទ. គណនីថ្មី TextToSpeechAI រួមបញ្ចូលទាំងឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃ, ហើយមាន demo មួយដែលអ្នកអាចរត់ដោយគ្មានការចុះឈ្មោះឡើង. នោះគឺគ្រប់គ្រាន់ដើម្បីបង្កើតប្រអប់ Dia ខ្លីមួយជាមួយ [S1] / [S2] ស្លាកមុនពេលសម្រេចចិត្តលើផែនការបង់ប្រាក់.

បាទ / ចាស ។ នៅពេលអ្នកមានតួអក្សរ API ពីទំព័រគណនីរបស់អ្នកអ្នកអាចដាក់ស្នើស្គ្រីបប្រអប់ Dia - រួមទាំង [S1] / [S2] វិលនិងស្លាកដូចជា [laughs] - ទៅ TextToSpeechAI REST API និងទាញយកអូឌីយ៉ូដែលទទួលបានដោយកម្មវិធី។

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 1
GPU VRAM 10GB
Credits/1000 chars 50

Try ថ្ងៃ Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

ថ្ងៃ

អំពី ថ្ងៃ

លក្ខណៈ​ពិសេស​សំខាន់

ការ​បង្កើត​ប្រអប់

សំឡេង​មិន​និយាយ​

ការ​ក្លូន​សំឡេង

ការ​សន្ទនា​ធម្មតា

ករណី​ប្រើ

របៀប​ប្រើ ថ្ងៃ

ចុះឈ្មោះដោយឥតគិតថ្លៃឬបើកការសាកល្បង

ជ្រើស​ម៉ាស៊ីន Dia

សរសេរ​ស្គ្រីប​ប្រអប់​ជាមួយ​ស្លាក

បង្កើត​អូឌីយ៉ូ

ទាញយក ឬ​ហៅ API

ថ្ងៃ API

សំណួរ​ដែល​សួរ​ញឹកញាប់

តើ Dia TTS ជា​អ្វី?

តើ Dia មាន​សេរីភាព​ក្នុង​ការ​ប្រើ​ពាណិជ្ជកម្ម​ឬ​ទេ?

តើ​ភាសា​អ្វី​ដែល Dia គាំទ្រ & # 160;?

តើ Dia ត្រូវការ​សតិ GPU ប៉ុន្មាន​?

តើ Dia អាច​បង្កើត​ប្រអប់​រវាង​តួអក្សរ​ច្រើន​បាន​ទេ & # 160;?

តើ​ស្លាក​អ្នក​និយាយ Dia [S1] និង [S2] ធ្វើការ​យ៉ាង​ដូចម្តេច?

តើ Dia ក្លូន​សំឡេង​ឬ & # 160;?

តើ​ស្លាក​មិន​និយាយ​ដូច​ជា [laughs] និង [sighs] មាន​សំឡេង​ដូច​ម្ដេច​ក្នុង Dia & # 160;?

ឌីយ៉ា vs Bark: តើខ្ញុំគួរប្រើអ្វី?

តើមានប៉ុន្មានសន្លឹកឆ្នោតដែល Dia ចំណាយលើ TextToSpeechAI?

តើខ្ញុំអាចសាកល្បង Dia TTS ដោយឥតគិតថ្លៃបានទេ?

តើខ្ញុំអាចប្រើ Dia តាមរយៈ TextToSpeechAI API បានទេ?

Technical Specs

Try ថ្ងៃ Now

Other TTS Engines

ស្ករ

ប្រអប់​និយាយ

សំឡេង​ស្រស់​ស្អាត ២Name

លក្ខណៈពិសេសសំខាន់

ការបង្កើតប្រអប់

សំឡេងមិននិយាយ

ការក្លូនសំឡេង

ការសន្ទនាធម្មតា

ករណីប្រើ

របៀបប្រើ ថ្ងៃ

ជ្រើសម៉ាស៊ីន Dia

សរសេរស្គ្រីបប្រអប់ជាមួយស្លាក

បង្កើតអូឌីយ៉ូ

ទាញយក ឬហៅ API

សំណួរដែលសួរញឹកញាប់

ប្រអប់និយាយ

សំឡេងស្រស់ស្អាត ២Name