កម្មវិធី​ច្រៀង​សំឡេង​ទៅ​ជា​អត្ថបទ

Standard

អត្ថបទ​ទៅ​ការ​និយាយ Neural រហ័ស និង​ស្រាល

Very Fast ល្បឿន​
Good គុណភាព
គ្មាន ក្លូន
20 ភាសា

អំពី កម្មវិធី​ច្រៀង​សំឡេង​ទៅ​ជា​អត្ថបទ

ing the cloud. Piper is an open source, local, neural text-to-speech system that is optimized for Raspberry Pi and other edge devices. It uses VITS-based models that have been trained on high-quality voice recordings, delivering natural-sounding speech without having to rely on cloud. Piper is an open source, local, neural text-to-speech system that

លក្ខណៈ​ពិសេស​សំខាន់

ការ​សំយោគ​លឿន​ខ្លាំង​បំផុត

បង្កើត​ការ​និយាយ​ក្នុង​ពេល​ពិត ទោះ​បី​ជា​លើ​ឧបករណ៍​ថាមពល​ទាប​ដូច Raspberry Pi ក៏ដោយ ។

បាន​ធ្វើ​ឲ្យ​ស៊ីភីយូ​ប្រសើរ​បំផុត

រត់​យ៉ាង​មាន​ប្រសិទ្ធភាព​លើ​ស៊ីភីយូ​ដោយ​មិន​ចាំបាច់​ Hardware GPU ថ្លៃ​ឡើយ ។

ភាសា 20+

គាំទ្រ​ភាសា​ជាង ២០ ជាមួយ​ការ​បញ្ចេញ​សំឡេង​គុណភាព​ដើម ។

ប្រតិបត្តិការ​ក្រៅ​បណ្ដាញ

ធ្វើការ​ក្រៅ​បណ្ដាញ​ទាំង​ស្រុង​ដោយ​មិន​ចាំបាច់​តភ្ជាប់​អ៊ីនធឺណិត​ឡើយ ។

ភាព​ឯកជន​ជា​មុន

ដំណើរការ​ទាំងអស់​កើត​ឡើង​ជា​មូលដ្ឋាន - អត្ថបទ​របស់​អ្នក​មិន​ដែល​ចាក​ចេញ​ពី​ឧបករណ៍​របស់​អ្នក​ឡើយ & # 160; ។

ប្រភព​បើកចំហ

ប្រភព​បើក​ចំហ​ទាំង​ស្រុង​ក្រោម​អាជ្ញាប័ណ្ណ MIT ជាមួយ​ការ​អភិវឌ្ឍ​សហគមន៍​សកម្ម ។

ករណី​ប្រើ

កម្មវិធី​ជំនួយ​ផ្ទះ​ឆ្លាត កម្មវិធី​មធ្យោបាយ​ងាយស្រួល ប្រព័ន្ធ​ទូរស័ព្ទ IVR ឧបករណ៍​ដែល​បាន​បង្កប់ កម្មវិធី​អប់រំName កម្មវិធី​ក្រៅ​បណ្ដាញ

កម្មវិធី​ច្រៀង​សំឡេង​ទៅ​ជា​អត្ថបទ Voices

View All 101
Alan (Fast) (UK English)
EN_GB
Alan (UK English)
EN_GB
Alba (UK English)
EN_GB
Alejandro (Spanish (Mexico))
ES_MX
Amir (Persian)
FA_IR
Amy (Fast) (US English)
EN_US
Amy (US English)
EN
Anders (Danish)
DA_DK
Anna (Hungarian)
HU_HU
Arctic (US English)
EN_US
Arthur (UK English)
EN_GB
Artur (Slovenian)
SL_SI

របៀប​ប្រើ កម្មវិធី​ច្រៀង​សំឡេង​ទៅ​ជា​អត្ថបទ

  1. 1

    ចុះឈ្មោះដោយឥតគិតថ្លៃឬបើកការសាកល្បង

    បង្កើតគណនី TextToSpeechAI ឥតគិតថ្លៃដើម្បីទទួលយកប្រាក់បញ្ញើចាប់ផ្តើម, ឬប្រើលើទំព័របង្ហាញដើម្បីព្យាយាម Piper ភ្លាមៗដោយគ្មានការចុះឈ្មោះចូល.

  2. 2

    ជ្រើស​សំឡេង Piper

    បើក​បណ្ណាល័យ​សំឡេង និង​តម្រង​ដោយ​ម៉ាស៊ីន Piper បន្ទាប់​មក​មើល​សំឡេង​ជាមុន​តាម​រយៈ​ភាសា​គោលដៅ និង​វណ្ណយុត្ត​របស់​អ្នក ដើម្បី​រក​មួយ​ដែល​ត្រឹមត្រូវ & # 160; ។

  3. 3

    បញ្ចូល ឬ​បិទភ្ជាប់​អត្ថបទ​របស់​អ្នក

    វាយ ឬ​បិទភ្ជាប់​ស្គ្រីប​ដែល​អ្នក​ចង់​និយាយ​ទៅ​ក្នុង​ប្រអប់​អត្ថបទ & # 160; ។ Piper ដោះស្រាយ​ការ​ដាក់​វណ្ណយុត្ត និង​អត្ថបទ​វែង​ល្អ ដូច្នេះ​អ្នក​អាច​ទម្លាក់​ក្នុង​កថាខណ្ឌ​ពេញលេញ & # 160; ។

  4. 4

    លៃតម្រូវ​ល្បឿន និង​បង្កើត

    កំណត់​ល្បឿន​និយាយ (ប្រហែល ០. ៥x ទៅ ២. ០x) ដើម្បី​សម​នឹង​គម្រោង​របស់​អ្នក បន្ទាប់​មក​ចុច បង្កើត ដើម្បី​ឲ្យ Piper សំយោគ​អូឌីយ៉ូ​ក្នុង​វិនាទី​នៅ​លើ​ស៊ីភីយូ & # 160; ។

  5. 5

    ទាញយក​អូឌីយ៉ូ ឬ​ហៅ API

    ទាញយក​វីដេអូ​របស់​អ្នក​ជា MP3 WAV ឬ OGG ពី​បន្ទះ​លទ្ធផល ឬ​ធ្វើ​ឲ្យ​វា​ស្វ័យប្រវត្តិ​ដោយ​ផ្ញើ​សំឡេង​របស់ Piper ដូចគ្នា​ទៅ​ចំណុច​បញ្ចប់ / v1 / generate / REST ។

កម្មវិធី​ច្រៀង​សំឡេង​ទៅ​ជា​អត្ថបទ API

បង្កើត​ការ​និយាយ​ដោយ​ប្រើ​កម្មវិធី​ដោយ​ប្រើ TextToSpeechAI REST API ។

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "សូម​ស្វាគមន៍​មក​កាន់ Piper ម៉ាស៊ីន​អត្ថបទ​ទៅ​ការ​និយាយ​ដែល​លឿន និង​ស្រាល \u0026 # 160\u003B ។",
    "voice": "en_GB-alan-low"
  }'

សំណួរ​ដែល​សួរ​ញឹកញាប់

Piper គឺជា​ម៉ាស៊ីន​អត្ថបទ​ទៅ​ជា​សំឡេង​ដែល​មាន​ល្បឿន​លឿន និង​ស្រាល​ដែល​បម្លែង​អត្ថបទ​ដែល​បាន​សរសេរ​ទៅ​ជា​សំឡេង​ធម្មជាតិ ។ វា​ប្រើ​ម៉ូដែល​រៀន​ជ្រៅ​ដែល​មាន​មូលដ្ឋាន​លើ VITS ដែល​បាន​ធ្វើ​ឲ្យ​ប្រសើរ​ឡើង​សម្រាប់​ការ​សន្និដ្ឋាន​ស៊ីភីយូ​មាន​ប្រសិទ្ធភាព ដែល​ធ្វើ​ឲ្យ Piper ល្អ​ឥតខ្ចោះ​សម្រាប់​ឧបករណ៍​ចុង ឧបករណ៍​ក្រៅ​បណ្ដាញ និង​កម្មវិធី​ពេលវេលា​ពិត ។ អ្នក​អាច​សាកល្បង Piper ដោយ​ឥត​គិត​ថ្លៃ​នៅ​លើ TextToSpeechAI ដោយ​ផ្ទាល់​ក្នុង​កម្មវិធី​រុករក​របស់​អ្នក ។

បាទ, Piper គឺ ពេញលេញ ឥត គិត ថ្លៃ និង ប្រភព បើកចំហ ក្រោម អាជ្ញាប័ណ្ណ MIT, ដូច្នេះ អ្នក អាច ប្រើ វា សម្រាប់ គម្រោង ផ្ទាល់ខ្លួន និង ពាណិជ្ជកម្ម ដោយ គ្មាន ថ្លៃ អាជ្ញាប័ណ្ណ. នៅ លើ TextToSpeechAI អ្នក អាច សាកល្បង Piper ដោយ ឥត គិត ថ្លៃ ជាមួយ មូលនិធិ ចាប់ផ្តើម របស់ អ្នក, និង ការ ប្រើ បន្ត ចំណាយ ត្រឹមតែ 10 មូលនិធិ ក្នុង 1000 តួអក្សរ.

បាទ/ ចាស Piper ត្រូវ​បាន​ចេញ​ផ្សាយ​ក្រោម​អាជ្ញាប័ណ្ណ MIT ដែល​អនុញ្ញាត​ឲ្យ​ប្រើ​ពាណិជ្ជកម្ម​ដោយ​ច្បាស់លាស់ & # 160; ។ អ្នក​អាច​ផ្ញើ​អូឌីយ៉ូ​ដែល​បង្កើត​ដោយ Piper ក្នុង​ផលិតផល​ពាណិជ្ជកម្ម វីដេអូ កម្មវិធី និង​សេវា​ដោយ​មិន​បង់​ប្រាក់​អាជ្ញាប័ណ្ណ ឬ​បន្ថែម​ការ​បញ្ជាក់ & # 160; ។

Piper គាំទ្រជាង 20 ភាសា, រួមទាំងភាសាអង់គ្លេស (អាមេរិក, ចក្រភពអង់គ្លេស, និងសំឡេងផ្សេងទៀត), អេស្ប៉ាញ, បារាំង, អាល្លឺម៉ង់, អ៊ីតាលី, ព័រទុយហ្គាល់, ហុងគ្រី, ប៉ុល, រុស្ស៊ី, និងច្រើនទៀត. ភាសានីមួយៗមកជាមួយសំឡេង Piper ជាច្រើនដែលបានបណ្តុះបណ្តាលមុនដើម្បីជ្រើសពីក្នុងបណ្ណាល័យសំឡេង TextToSpeechAI.

Piper គឺ​ជា​ម៉ាស៊ីន TTS មួយ​ក្នុង​ចំណោម​ម៉ាស៊ីន​ដែល​មាន​ល្បឿន​លឿន​បំផុត​ដែល​អាច​រក​បាន ហើយ​រត់​យ៉ាង​ងាយស្រួល​លើ​ស៊ីភីយូ ។ វា​អាច​បង្កើត​ការ​និយាយ​ក្នុង​ពេល​ពិត​ប្រាកដ​សូម្បី​តែ​លើ Raspberry Pi ដូច្នេះ​នៅ​លើ TextToSpeechAI Piper ភាគច្រើន​ស្នើ​សុំ​ត្រឡប់​អូឌីយ៉ូ​ក្នុង​រយៈពេល​ពីរ​វិនាទី ។

No, Piper does not support voice cloning - it only uses its pre-trained voice models. If you need to clone a specific voice from a sample, use a cloning engine like F5-TTS or Chatterbox on TextToSpeechAI instead.

Piper ផលិតច្បាស់, គុណភាពល្អអូឌីយ៉ូដែលសមនឹងអ្នកជំនួយការ, ប្រព័ន្ធ IVR, ការនិយាយ, និងឧបករណ៍ងាយស្រួលចូលដំណើរការ. វាមិនខ្ពស់-ពិតដូចម៉ូដែលប្រាក់រង្វាន់យឺត, ប៉ុន្តែអត្រាល្បឿន-ទៅ-គុណភាពរបស់វាគឺល្អសម្រាប់ករណីប្រើប្រចាំថ្ងៃភាគច្រើន.

គ្មាន GPU ត្រូវ​បាន​ទាមទារ - Piper ត្រូវ​បាន​រចនា​ដើម្បី​រត់​លើ CPU និង​ប្រើ​តែ​សតិ​មួយ​រយ​មេកាបៃ​ប៉ុណ្ណោះ & # 160; ។ នេះ​ជា​មូលហេតុ​ដែល Piper សម​នឹង​ក្រៅ​បណ្ដាញ និង​ការ​បង្កប់​ដែល​គ្មាន GPU ដែលបាន​បម្រុងទុក​ដែល​អាច​ប្រើ​បាន & # 160; ។

បាទ, Piper ត្រូវ បាន បង្កើត ឡើង សម្រាប់ មូលដ្ឋាន មូលដ្ឋាន រហ័ស និង រត់ ពេញលេញ ក្រៅ បណ្ដាញ មួយ ដង គំរូ សំឡេង របស់ វា ត្រូវ បាន ទាញ យក, ដោយ គ្មាន ការ តភ្ជាប់ អ៊ីនធឺណិត ដែល ត្រូវការ. ស្នាម ជើង តូច របស់ វា និង ស៊ីភីយូ-តែ រចនា ធ្វើ Piper មួយ នៃ ជម្រើស ល្អ បំផុត សម្រាប់ ក្រៅ បណ្ដាញ និង លើ ឧបករណ៍ និយាយ.

Piper និង Kokoro គឺ​ជា​ម៉ាស៊ីន​ដែល​លឿន CPU- friendly ស្តង់ដារ​កម្រិត​ម៉ាស៊ីន​ដែល​គ្មាន​ការ​ក្លូន​សំឡេង & # 160; ។ Piper មាន​បណ្ណាល័យ​សំឡេង​ច្រើន​ភាសា​ដ៏​ធំ ហើយ​មាន​ទម្ងន់​ស្រាល​ខ្លាំង​ណាស់ ខណៈ​ពេល Kokoro តែង​តែ​មាន​សំឡេង​ដែល​ប៉ះ​ច្រើន​ជាង​មុន ដូច្នេះ​ជ្រើស Piper សម្រាប់​ទទឹង​នៃ​សំឡេង និង​ធនធាន​តិចតួច និង Kokoro ពេល​អ្នក​ចង់​បាន​សំឡេង​លំនាំដើម​ដែល​រលូន & # 160; ។

Piper គឺនៅក្នុងកម្រិតតម្លៃស្តង់ដារ, ដែលចំណាយ 10 ឥណទានក្នុងមួយ 1000 តួអក្សរ - កម្រិតទាបបំផុតនៅលើ TextToSpeechAI. គណនីថ្មីទទួលបានឥណទានចាប់ផ្តើមដោយឥតគិតថ្លៃ, ដូច្នេះអ្នកអាចសាកល្បង Piper ដោយគ្មានការចំណាយមុនពេលប្តេជ្ញាចិត្ត.

ជ្រើស​សំឡេង Piper ពី​បណ្ណាល័យ​សំឡេង បន្ទាប់​មក​បញ្ជូន​សំឡេង​របស់​វា​ទៅ​ / v1 / generate / endpoint ជាមួយ​សញ្ញា​សម្គាល់ API របស់​អ្នក & # 160; ។ REST API បង្ហាញ​អូឌីយ៉ូ និង​ត្រឡប់​ URL ទាញយក ហើយ​អ្នក​អាច​ស្នើ​សុំ​លទ្ធផល MP3 WAV ឬ OGG & # 160; ។

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 20
  • GPU VRAM 500MB
  • Credits/1000 chars 10

Try កម្មវិធី​ច្រៀង​សំឡេង​ទៅ​ជា​អត្ថបទ Now

Generate your first audio free. No credit card required.

Start Free