វិត

Standard

ចុងបញ្ចប់ទៅចុងបញ្ចប់ TTS រហ័សជាមួយការនិយាយធម្មជាតិ

សាកល្បងដោយឥតគិតថ្លៃ វិត រកមើលសំឡេង (109)

Very Fast ល្បឿន

Good គុណភាព

គ្មាន ក្លូន

10 ភាសា

អំពី វិត

-efficient, and highly-efficient TTS model. It is designed to be used in the field of text-to-speech, and is based on the

លក្ខណៈពិសេសសំខាន់

ការសំយោគរហ័ស

សង់ស្ថាបត្យកម្មពីចុងទៅចុងសម្រាប់ការបង្កើតការនិយាយរហ័ស & # 160; ។

ការដំណើរការបាច់

ដំណើរការអត្ថបទច្រើនយ៉ាងមានប្រសិទ្ធភាពក្នុងពេលតែមួយ & # 160; ។

ការនិយាយធម្មតា

ការបណ្តុះបណ្តាល VAE+GAN បង្កើតការច្រៀងបែបធម្មជាតិ និងរោទិ៍ ។

ធុងបាសច្រើន

ម៉ូដែលតែមួយគាំទ្រសំឡេងអ្នកនិយាយច្រើន & # 160; ។

មានប្រសិទ្ធភាព

កម្រិតសតិទាបជាមួយការអនុវត្តល្អ & # 160; ។

ប្រភពបើកចំហ

MIT អាជ្ញាប័ណ្ណសម្រាប់ករណីប្រើណាមួយ & # 160; ។

ករណីប្រើ

ការបង្កើតអូឌីយ៉ូជាបាច់ វេទិកាសិក្សាតាមអ៊ីនធឺណិត កម្មវិធីអានព័ត៌មាន ការប្រកាសដោយស្វ័យប្រវត្តិ ប្រព័ន្ធ IVR មាតិកាកម្រិតសំឡេងខ្ពស់

វិត Voices

View All 109

LJSpeech (English Female)

VCTK Speaker 225 (English Female)

VCTK Speaker 226 (English Male)

VCTK Speaker 227 (English Male)

VCTK Speaker 228 (English Female)

VCTK Speaker 229

VCTK Speaker 230

VCTK Speaker 231

VCTK Speaker 232

VCTK Speaker 233

VCTK Speaker 234

VCTK Speaker 236

របៀបប្រើ វិត

1

ចុះឈ្មោះដោយឥតគិតថ្លៃឬព្យាយាមបង្ហាញ

បង្កើតគណនីឥតគិតថ្លៃ TextToSpeechAI ដើម្បីទទួលបានប្រាក់បញ្ញើចាប់ផ្តើម, ឬប្រើលើទំព័របង្ហាញដើម្បីឮ VITS មុនពេលចុះឈ្មោះ.
2

ជ្រើសសំឡេង ឬធុងបាស VITS

រកមើលបណ្ណាល័យសំឡេង និងជ្រើសសំឡេងដែលបានសម្គាល់ដោយសញ្ញា VITS & # 160; ។ បណ្ណាល័យ VITS ច្រើនអ្នកនិយាយ រួមទាំងសំណុំអ្នកនិយាយ VCTK អនុញ្ញាតឲ្យអ្នកជ្រើសពីសំឡេងខុសៗគ្នាជាច្រើន & # 160; ។
3

បញ្ចូលអត្ថបទរបស់អ្នក

វាយ ឬបិទភ្ជាប់អត្ថបទដែលអ្នកចង់និយាយទៅក្នុងកម្មវិធីនិពន្ធ & # 160; ។ VITS ដោះស្រាយអត្ថបទវែងល្អ ហើយវាល្អសម្រាប់បាច់ និងមាតិកាកម្រិតខ្ពស់ & # 160; ។
4

បង្កើតអូឌីយ៉ូ

ចុចបង្កើតដើម្បីសំយោគការនិយាយជាមួយ VITS ។ ដោយសារ VITS គឺលឿនណាស់ និងស្តង់ដារកម្រិត (10 ឥណទានក្នុងមួយ 1000 តួអក្សរ) លទ្ធផលត្រឡប់យ៉ាងឆាប់រហ័សក្នុងតម្លៃទាប ។
5

ទាញយក ឬប្រើ API

ទាញយកអូឌីយ៉ូដែលបានបញ្ចប់ជា MP3, WAV ឬ OGG ឬហៅសំឡេង VITS ដូចគ្នាតាមរយៈ TextToSpeechAI REST API ដើម្បីបង្កើតស្វ័យប្រវត្តិក្នុងកម្មវិធីផ្ទាល់ខ្លួនរបស់អ្នក ។

វិត API

បង្កើតការនិយាយដោយប្រើកម្មវិធីដោយប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS ផ្ដល់ការនិយាយធម្មតារហ័សសម្រាប់កម្មវិធីកម្រិតខ្ពស់ \u0026 # 160\u003B ។",
    "voice": "vits-ljspeech"
  }'

អានឯកសារ API យកកូនសោ API របស់អ្នក

សំណួរដែលសួរញឹកញាប់

VITS (ការសន្និដ្ឋានខុសគ្នាជាមួយនឹងការរៀនសូត្រប្រឆាំងសម្រាប់អត្ថបទទៅជាសំឡេងពីចុងទៅចុង) គឺជាម៉ូដែល TTS សរសៃប្រសាទពីចុងទៅចុងដែលរួមបញ្ចូលគ្នានូវកម្មវិធីអ៊ិនកូដស្វ័យប្រវត្តិដែលមានការបណ្តុះបណ្តាល GAN ប្រឆាំង។ វាបង្កើតការនិយាយដែលមានសំឡេងធម្មជាតិក្នុងដំណាក់កាលតែមួយដែលធ្វើឱ្យវាលឿននិងមានប្រសិទ្ធភាព។ អ្នកអាចសាកល្បង VITS ដោយឥតគិតថ្លៃនៅលើ TextToSpeechAI ។

បាទ, VITS គឺជាប្រភពបើកចំហក្រោមអាជ្ញាប័ណ្ណ MIT, ដូច្នេះវាគាំទ្រការប្រើពាណិជ្ជកម្មពេញលេញដោយគ្មានការកំណត់. វាត្រូវបានប្រើយ៉ាងទូលំទូលាយនៅក្នុងផលិតផលនិងសេវាកម្មពាណិជ្ជកម្ម. នៅលើ TextToSpeechAI, VITS ចំណាយ 10 ឥណទានក្នុងមួយ 1000 តួអក្សរនៅលើកម្រិតស្តង់ដារ.

TextToSpeechAI ផ្ដល់បណ្ណាល័យ VITS ធំមួយដែលមានអ្នកនិយាយច្រើនរួមទាំងសំឡេង VCTK ដែលបានកំណត់ជាមួយអ្នកនិយាយភាសាអង់គ្លេសខុសគ្នារាប់ពាន់នាក់ ។ ម៉ូដែល VITS មួយអាចធ្វើជាម្ចាស់អ្នកនិយាយច្រើនដូច្នេះអ្នកអាចជ្រើសពីសំឡេងផ្សេងគ្នាជាច្រើនដោយមិនប្តូរម៉ាស៊ីន ។

ការគាំទ្រ VITS ផ្អែកលើគំរូដែលបានហ្វឹកហាត់ & # 160; ។ គំរូ VITS ទូទៅគ្របដណ្តប់ភាសាអង់គ្លេស ចិន ជប៉ុន កូរ៉េ អាល្លឺម៉ង់ បារាំង និងភាសាសំខាន់ផ្សេងទៀតដែលមានការគ្របដណ្តប់ភាសាអង់គ្លេសច្រើនអ្នកនិយាយពីសំណុំទិន្នន័យ VCTK & # 160; ។

VITS គឺលឿនណាស់ បង្កើតការនិយាយក្នុងពេលពិត ឬលឿនជាងលើ GPU ។ ស្ថាបត្យកម្មចុងបញ្ចប់របស់វាជៀសវាងដំណាក់កាលដំណើរការច្រើននៃម៉ូដែលផ្សេងទៀត ដែលជាមូលហេតុដែល VITS គឺសមនឹងការបង្កើតបាច់ និងកម្រិតខ្ពស់ ។

No, VITS does not support voice cloning. It uses pre-trained multi-speaker models rather than copying a target voice from a sample. For voice cloning on TextToSpeechAI, use F5-TTS or GPT-SoVITS instead.

VITS បង្កើតអូឌីយ៉ូគុណភាពល្អជាមួយនឹងការនិយាយធម្មតា និងរោទិ៍ & # 160; ។ ខណៈពេលដែលវាមិននៅកម្រិត StyleTTS2ឬ Tortoise វាផ្ដល់គុណភាពល្អសម្រាប់ល្បឿនរបស់វា ជាពិសេសសម្រាប់ដំណើរការបាច់ & # 160; ។

VITS គឺមានប្រសិទ្ធភាពក្នុងការប្រើប្រាស់សតិជាធម្មតាត្រូវការតែមួយចំនួននៃGB នៃ VRAM (នៅជុំវិញ 4GB) ។ វារត់យ៉ាងងាយស្រួលលើ GPUs របស់អ្នកប្រើប្រាស់ ហើយនៅលើ TextToSpeechAI ការបង្ហាញទាំងអស់កើតឡើងលើម៉ាស៊ីនបម្រើរបស់យើង ដូច្នេះអ្នកមិនត្រូវការផ្នែករឹងណាមួយរបស់អ្នកផ្ទាល់ឡើយ ។

VITS និង Piper គឺជាម៉ាស៊ីនស្តង់ដារកម្រិតខ្ពស់ដែលបានអនុញ្ញាតដោយ MIT លើ TextToSpeechAI & # 160; ។ Piper គឺជាជម្រើសស្រាល និងលឿនបំផុត ខណៈពេល VITS ផ្ដល់បណ្ណាល័យអ្នកនិយាយច្រើនធំ (រួមបញ្ចូល VCTK) ជាមួយនឹងការនិយាយធម្មតាបន្តិចបន្តួច & # 160; ។ ទាំងពីរមិនគាំទ្រការក្លូនសំឡេងទេ & # 160; ។

VITS គឺជាម៉ាស៊ីនស្តង់ដារកម្រិត, ចំណាយ 10 ឥណទានក្នុងមួយ 1000 តួអក្សរ. នេះជាកម្រិតទាបបំផុតរបស់យើងតម្លៃអរគុណដល់ប្រសិទ្ធភាព, ធម្មជាតិលឿននៃគំរូ VITS.

VITS បង្កើតអូឌីយ៉ូនៅ 22050Hz ដើម ។ តាមរយៈ TextToSpeechAI អ្នកអាចស្នើសុំ MP3 WAV ឬ OGG ទ្រង់ទ្រាយជាមួយការបម្លែងស្វ័យប្រវត្តិដែលបានដោះស្រាយសម្រាប់អ្នក ។

ចុះឈ្មោះនៅលើ TextToSpeechAI ដើម្បីទទួលយកឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃ, បន្ទាប់មកជ្រើសសំឡេង VITS, បញ្ចូលអត្ថបទរបស់អ្នក, និងបង្កើតអូឌីយ៉ូ. អ្នកក៏អាចប្រើការបង្ហាញដើម្បីឮ VITS មុនពេលបង្កើតគណនីមួយ, និងចូលដំណើរការ VITS តាមរយៈ REST API របស់យើងនៅពេលដែលអ្នកចុះឈ្មោះ.

Technical Specs

Generation Speed Very Fast
Output Quality Good
Voice Cloning Not Supported
Languages 10
GPU VRAM 1-2GB
Credits/1000 chars 10

Try វិត Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

វិត

អំពី វិត

លក្ខណៈ​ពិសេស​សំខាន់

ការ​សំយោគ​រហ័ស

ការ​ដំណើរការ​បាច់

ការ​និយាយ​ធម្មតា

ធុងបាស​ច្រើន

​មាន​ប្រសិទ្ធភាព

ប្រភព​បើកចំហ

ករណី​ប្រើ

វិត Voices

LJSpeech (English Female)

VCTK Speaker 225 (English Female)

VCTK Speaker 226 (English Male)

VCTK Speaker 227 (English Male)

VCTK Speaker 228 (English Female)

VCTK Speaker 229

VCTK Speaker 230

VCTK Speaker 231

VCTK Speaker 232

VCTK Speaker 233

VCTK Speaker 234

VCTK Speaker 236

របៀប​ប្រើ វិត

ចុះឈ្មោះដោយឥតគិតថ្លៃឬព្យាយាមបង្ហាញ

ជ្រើស​សំឡេង ឬ​ធុងបាស VITS

បញ្ចូល​អត្ថបទ​របស់​អ្នក

បង្កើត​អូឌីយ៉ូ

ទាញយក ឬ​ប្រើ API

វិត API

សំណួរ​ដែល​សួរ​ញឹកញាប់

តើ VITS TTS ជាអ្វី?

តើ VITS ឥតគិតថ្លៃ​សម្រាប់​ប្រើ​ពាណិជ្ជកម្ម​ឬ​ទេ?

តើ​មាន​សំឡេង VITS ប៉ុន្មាន​នៅ​ទីនោះ & # 160;?

តើ​ភាសា​អ្វី​ដែល VITS គាំទ្រ & # 160;?

តើ VITS ដំណើរការ​លឿន​ប៉ុនណា?

តើ VITS គាំទ្រ​ការ​ក្លូន​សំឡេង​ឬ & # 160;?

តើ​គុណភាព​អូឌីយ៉ូ​របស់ VITS ជា​អ្វី & # 160;?

តើ​សតិ GPU ប៉ុន្មាន​ដែល VITS ត្រូវការ & # 160;?

VITS ប្រឆាំងនឹង Piper: តើខ្ញុំគួរប្រើមួយណា?

តើ VITS ចំណាយប៉ុន្មានលើ TextToSpeechAI?

តើ​ទ្រង់ទ្រាយ​អូឌីយ៉ូ​អ្វី​ដែល​លទ្ធផល VITS ប្រើ & # 160;?

តើខ្ញុំអាចសាកល្បង VITS ដោយឥតគិតថ្លៃបានយ៉ាងដូចម្តេច?

Technical Specs

Try វិត Now

Other TTS Engines

ស្ករ

ប្រអប់​និយាយ

សំឡេង​ស្រស់​ស្អាត ២Name

លក្ខណៈពិសេសសំខាន់

ការសំយោគរហ័ស

ការដំណើរការបាច់

ការនិយាយធម្មតា

ធុងបាសច្រើន

មានប្រសិទ្ធភាព

ប្រភពបើកចំហ

ករណីប្រើ

របៀបប្រើ វិត

ជ្រើសសំឡេង ឬធុងបាស VITS

បញ្ចូលអត្ថបទរបស់អ្នក

បង្កើតអូឌីយ៉ូ

ទាញយក ឬប្រើ API

សំណួរដែលសួរញឹកញាប់

ប្រអប់និយាយ

សំឡេងស្រស់ស្អាត ២Name