ស្ករ

Premium

សម្ដី AI ប្រកប​ដោយ​អារម្មណ៍ និង​បែបផែន​សំឡេង

Slow ល្បឿន​
Very Good គុណភាព
គ្មាន ក្លូន
13 ភាសា

អំពី ស្ករ

-text audio. Bark is an open source, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit

លក្ខណៈ​ពិសេស​សំខាន់

ការ​បង្ហាញ​អារម្មណ៍

បង្កើត​ការ​និយាយ​ជាមួយ​នឹង​ការ​ញញឹម ដកដង្ហើម ដកដង្ហើម និង​អារម្មណ៍​ពិត ។

សញ្ញា​សម្គាល់​អារម្មណ៍

ប្រើ [laugh], [sighs], CAPS សម្រាប់​ការ​សង្កត់​ធ្ងន់ និង... សម្រាប់​ការ​ស្ទាក់ស្ទើរ & # 160; ។

ភាសា​ច្រើន

គាំទ្រ 13+ ភាសាជាមួយសំឡេង និង ការ និយាយ ធម្មជាតិ ។

តន្ត្រី និង​បែបផែន

អាច​បង្កើត​តន្ត្រី​ធម្មតា និង​សំឡេង​បរិស្ថាន ។

ការ​កំណត់​ជាមុន​របស់​អ្នក​និយាយ

សំឡេង​អ្នក​និយាយ​ដែល​បាន​បង្ហាត់​ជាមុន​ច្រើន​ជាមួយ​រចនាប័ទ្ម​ផ្សេង​គ្នា & # 160; ។

ប្រភព​បើកចំហ

MIT អាជ្ញាប័ណ្ណ​ជាមួយ​នឹង​សិទ្ធិ​ប្រើ​ពាណិជ្ជកម្ម​ពេញលេញ & # 160; ។

ករណី​ប្រើ

ប្រអប់​តួអក្សរ មាតិកា​មាន​ចលនា ការ​និយាយ​សៀវភៅ​អូឌីយ៉ូ ការ​សម្ដែង​សំឡេង​ល្បែង គម្រោង​ច្នៃប្រឌិត អ្នក​ជំនួយការ​បង្ហាញ

ស្ករ Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

របៀប​ប្រើ ស្ករ

  1. 1

    ចុះឈ្មោះដោយឥតគិតថ្លៃនិងបើកការសាកល្បង

    បង្កើតដោយឥតគិតថ្លៃ TextToSpeechAI គណនីដើម្បីទាមទារប្រាក់រង្វាន់អ្នកចាប់ផ្តើមដំបូងរបស់អ្នក, ឬប្រើការបង្ហាញគ្មានការចុះឈ្មោះដើម្បីព្យាយាម Bark ភ្លាម. ឥណទានឥតគិតថ្លៃគឺគ្រប់គ្រាន់ដើម្បីបង្កើតវីដេអូ Bark បង្ហាញជាច្រើនមុនពេលអ្នកធ្វើឱ្យប្រសើរឡើង.

  2. 2

    ជ្រើស​សំឡេង​របស់ Bark

    បើក​បណ្ណាល័យ​សំឡេង ហើយ​ជ្រើស​ការ​កំណត់​ជាមុន​របស់​អ្នក​និយាយ Bark ដែល​ផ្គូផ្គង​នឹង​សំឡេង​ដែល​អ្នក​ចង់​បាន & # 160; ។ សំឡេង Bark ត្រូវ​បាន​ដាក់​ស្លាក​ជា​កម្រិត​ខ្ពស់ (២៥ ក្រេឌីត​ក្នុង​មួយ​តួអក្សរ ១០០០) ហើយ​ត្រូវ​បាន​កំណត់​សម្រាប់​អារម្មណ៍ ភាព​និយាយ​បែប​តួអក្សរ & # 160; ។

  3. 3

    បញ្ចូល​អត្ថបទ​ដែល​មាន​សញ្ញា​សម្គាល់​អារម្មណ៍

    វាយ​ស្គ្រីប​របស់​អ្នក និង​បង្កប់​សញ្ញា​សម្គាល់​អារម្មណ៍​ក្នុង​បន្ទាត់ & # 160; ៖ [laughter] សម្រាប់​ការ​យំ [sighs] សម្រាប់​ការ​យំ [gasps] សម្រាប់​ការ​យំ... សម្រាប់​ការ​ផ្អាក និង CAPS សម្រាប់​ការ​សង្កត់​ធ្ងន់ & # 160; ។ ឧទាហរណ៍ & # 160; ៖ "អូ វ៉ៃ! [laughter] នេះ​គឺ​អស្ចារ្យ... ខ្ញុំ​មិន​អាច​ជឿ​វា​បាន​ទេ!"

  4. 4

    បង្កើត​អូឌីយ៉ូ

    ចុច បង្កើត និង Bark បង្ហាញ​អត្ថបទ​របស់​អ្នក​ជា​ការ​និយាយ​ដែល​បង្ហាញ​ ប្រែ​សម្រួល​សញ្ញា​សម្គាល់​នីមួយៗ​ទៅ​ជា​សំឡេង​ដែល​ផ្គូផ្គង & # 160; ។ ការ​បង្កើត​យឺត​ជាង​ម៉ាស៊ីន​ស្រាល​ដោយ​សារ​តែ​ម៉ូដែល​បម្លែង​របស់ Bark ដូច្នេះ​អនុញ្ញាត​ឲ្យ​មាន​វិនាទី​បន្ថែម​មួយ​ចំនួន​ក្នុង​មួយ​ឃ្លា & # 160; ។

  5. 5

    ទាញយក ឬ​ប្រើ API

    មើលលទ្ធផលជាមុន, បន្ទាប់មកទាញយកវាជា MP3, WAV, ឬ OGG ។ ដើម្បីធ្វើអោយ Bark ស្វ័យប្រវត្តិនៅក្នុងកម្មវិធីផ្ទាល់ខ្លួនរបស់អ្នក, ទូរស័ព្ទទៅ TextToSpeechAI API ជាមួយសំឡេង Bark និងអត្ថបទដែលមានចំណេះដឹងដូចគ្នាដើម្បីទទួលបានត្រឡប់មកវិញសំឡេងបង្ហាញ។

ស្ករ API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "អូ wow! [យំ] នេះជាអស្ចារ្យ... ខ្ញុំគ្រាន់តែស្រឡាញ់របៀបដែលបង្ហាញនេះសំឡេង!",
    "voice": "bark-zh_0"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

Bark គឺ​ជា​គំរូ​អត្ថបទ​ទៅ​ជា​អូឌីយ៉ូ​ដែល​មាន​មូលដ្ឋាន​លើ​ការ​បម្លែង​ដែល​បាន​បង្កើត​ដោយ Suno & # 160; ។ មិន​ដូច​ជា​ប្រព័ន្ធ TTS បុរាណ​ទេ Bark បង្កើត​ការ​និយាយ​ដែល​មាន​ការ​បង្ហាញ​ខ្ពស់​ជាមួយ​នឹង​អារម្មណ៍​ធម្មជាតិ ភាព​សប្បាយ​រីករាយ ភាព​ស្រណោះ​ស្រណោះ និង​សំឡេង​មិន​និយាយ​ផ្សេង​ទៀត & # 160; ។ វា​អាច​បង្កើត​តន្ត្រី និង​បែបផែន​សំឡេង & # 160; ។

នៅលើ TextToSpeechAI, យើង គិត ថ្លៃ 25 ឥណទាន ក្នុង មួយ 1000 តួអក្សរ ដោយសារតែ ធនធាន GPU សំខាន់ ដែល ត្រូវ បាន ទាមទារ សម្រាប់ ការ បង្កើត.

Bark គាំទ្រ 13+ ភាសារួមទាំងភាសាអង់គ្លេស, អាល្លឺម៉ង់, អេស្ប៉ាញ, បារាំង, ឥណ្ឌា, អ៊ីតាលី, ជប៉ុន, កូរ៉េ, ប៉ុល ពត, ព័រទុយហ្គាល់, រុស្ស៊ី, អ៊ុយក្រែន, និងចិន. ភាសានីមួយៗមានការបញ្ចេញសំឡេងនិងសំឡេងធម្មជាតិ.

Bark គឺ​យឺត​ជាង​ម៉ាស៊ីន TTS ភាគច្រើន​ដោយសារ​ស្ថាបត្យកម្ម​ប្តូរ​រូបរាង​ស្វ័យប្រវត្តិ​របស់​វា & # 160; ។ ឃ្លា​ធម្មតា​ត្រូវ​ចំណាយ​ពេល ៥- ១៥ វិនាទី​ដើម្បី​បង្កើត​លើ GPU & # 160; ។ ការ​ផ្លាស់ប្តូរ​គឺ​ជា​លទ្ធផល​ដែល​មាន​លក្ខណៈ​បង្ហាញ និង​ធម្មជាតិ​ច្រើន​ជាង​នេះ & # 160; ។

Bark ផ្ដល់​តែ​ការ​ក្លូន​សំឡេង​ដែល​មាន​កម្រិត​តែ​ប៉ុណ្ណោះ​តាម​រយៈ "ការ​ជូន​ដំណឹង​សមីការ" និង​ការ​កំណត់​ជាមុន​របស់​អ្នក​និយាយ ដូច្នេះ​វា​មិន​អាច​ក្លូន​សំឡេង​ដោយ​ស្វ័យ​ប្រវត្តិ​ពី​គំរូ​បាន​ទេ ។ ប្រសិន​បើ​ការ​ក្លូន​សំឡេង​ពេញលេញ​គឺ​ជា​គោលដៅ​របស់​អ្នក ប្រើ F5- TTS StyleTTS2 OpenVoice ឬ Tortoise ជំនួស​វិញ​ទាំងអស់​អាច​ប្រើ​បាន​នៅ TextToSpeechAI ។

Bark អាន​សញ្ញា​សម្គាល់​ក្នុង​បន្ទាត់​ដែល​បាន​ដាក់​ដោយ​ផ្ទាល់​ក្នុង​អត្ថបទ​របស់​អ្នក ហើយ​ប្ដូរ​ពួក​វា​ទៅ​ជា​សំឡេង​ដែល​ផ្គូផ្គង & # 160; ។ ប្រើ [laughter] សម្រាប់​ការ​យំ [sighs] សម្រាប់​ការ​យំ [gasps] សម្រាប់​ការ​យំ... សម្រាប់​ការ​ស្ទាក់ស្ទើរ ឬ​ការ​ផ្អាក និង CAPS សម្រាប់​ការ​សង្កត់​ធ្ងន់ & # 160; ។ ឧទាហរណ៍ & # 160; ៖ "អូ វ៉ៃ! [laughter] នេះ​គឺ​អស្ចារ្យ... ខ្ញុំ​មិន​អាច​ជឿ​វា​បាន​ទេ!"

ក្រៅពី​ការ​និយាយ​ធម្មតា, Bark អាច​ផលិត​សំឡេង​មិន​និយាយ​ដូច​ជា​ការ​ញញឹម, យំ, ដកដង្ហើម, ដកដង្ហើម​ច្រមុះ, និង​ការ​និយាយ​មិន​ច្បាស់, បន្ថែម​តន្ត្រី​សាមញ្ញ និង​ផល​ប៉ះពាល់​បរិស្ថាន. ទាំងនេះ​ត្រូវបាន​កេះ​ដោយ​មាន​សញ្ញា​សម្គាល់​ដូចជា [យំ], [ដកដង្ហើម], និង [ដកដង្ហើម] បង្កប់​ក្នុង​អត្ថបទ, ដែល​ជា​អ្វី​ដែល​ធ្វើ​ឲ្យ Bark អារម្មណ៍​ច្រើន​ជាង​ការ​បង្ហាញ​ពី TTS ស្តង់ដារ.

Bark ផលិត​សំឡេង​គុណភាព​ល្អ​បំផុត​ជាមួយ​នឹង​ការ​បង្ហាញ​ធម្មជាតិ​ដែល​ប្រកួត​ប្រជែង​ជាមួយ​នឹង​ការ​និយាយ​របស់​មនុស្ស​សម្រាប់​មាតិកា​អារម្មណ៍ ។ លទ្ធផល 24kHz មាន​សំឡេង​វិជ្ជាជីវៈ ទោះបី​ជា​គុណភាព​នៃ​ការ​និយាយ​សុទ្ធ​គឺ​នៅ​ក្រោម StyleTTS2 បន្តិច ។

Bark ត្រូវការ 8-12GB នៃ VRAM អាស្រ័យលើទំហំម៉ូដែល។ ម៉ូដែលពេញលេញត្រូវការ ~ 12GB ខណៈពេលដែលកំណែតូចជាងនេះធ្វើការជាមួយ 8GB ។ ការសន្និដ្ឋាន CPU គឺយឺតណាស់ហើយមិនត្រូវបានណែនាំទេ។

បាទ, ស្លឹកឈើគឺជា MIT អាជ្ញាប័ណ្ណ, ដែលអនុញ្ញាតឱ្យការប្រើប្រាស់ពាណិជ្ជកម្មមិនកំណត់ដោយគ្មានថ្លៃអាជ្ញាប័ណ្ណ. អ្នកអាចប្រើស្លឹកឈើនៅក្នុងផលិតផល, សេវានិងកម្មវិធីដោយសេរី. នៅលើ TextToSpeechAI អ្នកអាចព្យាយាមស្លឹកឈើដោយឥតគិតថ្លៃដោយប្រើឥណទានចុះឈ្មោះរបស់អ្នកមុនពេលបង់ប្រាក់សម្រាប់ច្រើន.

Bark ល្អប្រសើរនៅការនិយាយរបស់អ្នកនិយាយតែមួយដែលមានសញ្ញាអារម្មណ៍ដូចជា [ការយំ] និង [សើច] ខណៈពេលដែល Dia ត្រូវបានបង្កើតឡើងសម្រាប់ប្រអប់អ្នកនិយាយច្រើនជាមួយ [S1] / [S2] វិលនិងមិននិយាយ។ ជ្រើស Bark សម្រាប់ការនិយាយអារម្មណ៍និងសំឡេងតួអក្សរនិង Dia សម្រាប់ការសន្ទនាត្រឡប់មកវិញនិងត្រឡប់មកវិញ។ ទាំងពីរគឺមាននៅលើ TextToSpeechAI ។

Bark មាន​លក្ខណៈ​ពិសេស​ក្នុង​សមត្ថភាព​របស់​វា​ក្នុង​ការ​បង្កើត​ការ​និយាយ​ដែល​មាន​អារម្មណ៍​ពិត និង​សំឡេង​មិន​និយាយ​ & # 160; ។ វា​យឺត​ជាង​ម៉ាស៊ីន​ផ្សេង​ទៀត ប៉ុន្តែ​វា​ផលិត​លទ្ធផល​ដូច​មនុស្ស​ច្រើន​សម្រាប់​មាតិកា​ច្នៃ​ប្រឌិត & # 160; ។ សម្រាប់​ការ​បង្កើត​លឿន​ជាង​នេះ ប្រើ Piper & # 160; ។ សម្រាប់​ក្លូន​សំឡេង ប្រើ F5- TTS ឬ OpenVoice & # 160; ។

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try ស្ករ Now

Generate your first audio free. No credit card required.

Start Free