ວີທີສName

Standard

ໄວສຸດທ້າຍເຖິງສຸດທ້າຍ TTS ກັບການເວົ້າທໍາມະຊາດ

Very Fast ໄວ

Good ຄຸນນະພາບ

ບໍ່ໄດ້ ក្លូន

10 ພາສາ

ກ່ຽວກັບ ວີທີສName

-efficient, and highly-efficient TTS model. It is designed to be used in the field of text-to-speech, and is based on the

ຄຸນສົມບັດຫຼັກ

ການສັງເຄາະໄວ

ໂຄງສ້າງພື້ນຖານ End-to-end ເພື່ອສ້າງການເວົ້າຢ່າງໄວວາ.

ການປະມວນຜົນແບດ

ຈັດການຂໍ້ຄວາມຫຼາຍຢ່າງໃນເວລາດຽວກັນຢ່າງມີປະສິດທິຜົນ.

ເວົ້າແບບທໍາມະຊາດ

ການຝຶກ VAE+GAN ເຮັດໃຫ້ເກີດການເວົ້າ ແລະ ຮ້ອງເພງແບບທຳມະຊາດ.

ຫຼາຍໄມໂຄຣໂຟນ

ແບບດຽວນີ້ຮອງຮັບສຽງຫຼາຍຄົນ

ປະສິດທິພາບ

ໃຊ້ພື້ນທີ່ໃນສະໝອງຕ່ຳກັບປະສິດທິພາບທີ່ດີ.

ແຫຼ່ງເປີດ

MIT ອະນຸຍາດໃຫ້ໃຊ້ໄດ້ທຸກກໍລະນີ

ກໍລະນີໃຊ້

ສ້າງສຽງຫຼາຍຄັ້ງ ເວທີການຮຽນຮູ້ທາງອີເລັກໂຕຣນິກ កម្មវិធីອ່ານຂ່າວName ການແຈ້ງເຕືອນແບບອັດຕະໂນມັດ ລະບົບ IVR ເນື້ອໃນທີ່ມີສຽງສູງ

ວີທີສName Voices

View All 109

LJSpeech (English Female)

VCTK Speaker 225 (English Female)

VCTK Speaker 226 (English Male)

VCTK Speaker 227 (English Male)

VCTK Speaker 228 (English Female)

VCTK Speaker 229

VCTK Speaker 230

VCTK Speaker 231

VCTK Speaker 232

VCTK Speaker 233

VCTK Speaker 234

VCTK Speaker 236

ວິທີການໃຊ້ ວີທີສName

1

ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo

ສ້າງບັນຊີ TextToSpeechAI ໂດຍບໍ່ເສຍຄ່າ ເພື່ອໄດ້ຮັບເງິນກູ້ເລີ່ມຕົ້ນ, ຫຼືໃຊ້ການສະແດງໃນ ໜ້າ ເພື່ອຟັງ VITS ກ່ອນທີ່ຈະລົງທະບຽນ.
2

ເລືອກສຽງ ຫຼື ໄມໂຄຣໂຟນ VITS

ຄົ້ນຫາຫໍສະໝຸດສຽງ ແລະ ເລືອກສຽງທີ່ໄດ້ສະແດງດ້ວຍປ້າຍສະແດງຊື່ VITS. ຫໍສະໝຸດ VITS ທີ່ມີຫຼາຍເຄື່ອງເວົ້າ, ລວມທັງຊຸດເຄື່ອງເວົ້າ VCTK, ອະນຸຍາດໃຫ້ທ່ານເລືອກສຽງທີ່ແຕກຕ່າງກັນຫຼາຍຢ່າງ.
3

បញ្ចូលຂໍ້ຄວາມຂອງທ່ານ

ພິມ ຫຼື ບິດຂໍ້ຄວາມທີ່ທ່ານຕ້ອງການເວົ້າເຂົ້າໃນຕົວຈັດການຂໍ້ຄວາມ. VITS ຈັດການກັບຂໍ້ຄວາມຍາວໄດ້ດີ ແລະ ດີທີ່ສຸດສຳລັບເນື້ອໃນຫຼາຍໆອັນ ແລະ ເນື້ອໃນທີ່ມີປະລິມານສູງ.
4

ສ້າງສຽງ

ກົດເພື່ອສ້າງການເວົ້າດ້ວຍ VITS. ຍ້ອນວ່າ VITS ໄວຫຼາຍ ແລະ ມາດຕະຖານລະດັບ (10 ຄະແນນຕໍ່ 1000 ຕົວອັກສອນ), ຜົນໄດ້ຮັບກັບຄືນໄວໃນລາຄາຕ່ຳ.
5

ດາວໂຫລດ ຫຼື ໃຊ້ API

ດາວໂຫລດສຽງທີ່ສໍາເລັດເປັນ MP3, WAV, ຫຼື OGG, ຫຼືໂທຫາສຽງ VITS ດຽວກັນຜ່ານ TextToSpeechAI REST API ເພື່ອຜະລິດອັດຕະໂນມັດໃນໂປແກຼມຂອງທ່ານເອງ.

ວີທີສName API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS ສົ່ງໃຫ້ໄວ, ເວົ້າທໍາມະຊາດສໍາລັບການໃຊ້ງານທີ່ມີປະລິມານສູງ.",
    "voice": "vits-ljspeech"
  }'

ອ່ານເອກະສານ API ເອົາກຸນແຈ API ຂອງທ່ານ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) ແມ່ນແບບ ຈຳ ລອງ TTS ແບບ neural end-to-end ທີ່ປະສົມປະສານກັບ autoencoder ແບບ variational ກັບການຝຶກອົບຮົມ GAN ແບບ adversarial. ມັນຜະລິດການເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດໃນບາດກ້າວດຽວ, ເຊິ່ງເຮັດໃຫ້ມັນໄວແລະມີປະສິດຕິພາບ. ທ່ານສາມາດທົດລອງ VITS ຟຣີໃນ TextToSpeechAI.

VITS ແມ່ນ Open Source ຕາມໃບອະນຸຍາດ MIT, ສະນັ້ນມັນສະຫນັບສະຫນູນການໃຊ້ທຸລະກິດເຕັມທີ່ໂດຍບໍ່ມີຂໍ້ຈໍາກັດ. ມັນຖືກນໍາໃຊ້ຢ່າງກວ້າງຂວາງໃນຜະລິດຕະພັນແລະການບໍລິການການຄ້າ. ສໍາລັບ TextToSpeechAI, VITS ຄ່າໃຊ້ຈ່າຍ 10 ເຄດິດຕໍ່ 1000 ຕົວອັກສອນໃນລະດັບມາດຕະຖານ.

TextToSpeechAI ສະຫນອງຫໍສະໝຸດ VITS ທີ່ມີຫຼາຍຜູ້ເວົ້າ, ລວມທັງສຽງ VCTK ທີ່ມີຜູ້ເວົ້າພາສາອັງກິດທີ່ແຕກຕ່າງກັນຫຼາຍສິບຄົນ. ແບບ VITS ດຽວສາມາດຈັດການກັບຜູ້ເວົ້າຫຼາຍຄົນ, ສະນັ້ນທ່ານສາມາດເລືອກສຽງທີ່ແຕກຕ່າງກັນຫຼາຍຢ່າງໄດ້ໂດຍບໍ່ຕ້ອງປ່ຽນເຄື່ອງຈັກໄດ້.

ການສະໜັບສະໜູນ VITS ຂຶ້ນກັບແບບທີ່ໄດ້ຮຽນຮູ້ແລ້ວ. ແບບ VITS ທົ່ວໄປປະກອບດ້ວຍພາສາອັງກິດ, ຈີນ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ເຢຍລະມັນ, ຝຣັ່ງ ແລະ ພາສາອື່ນໆທີ່ສຳຄັນ, ພ້ອມດ້ວຍການປົກຄຸມພາສາອັງກິດທີ່ມີຫຼາຍຄົນເວົ້າຈາກຊຸດຂໍ້ມູນ VCTK.

VITS ແມ່ນໄວຫຼາຍ, ສ້າງການເວົ້າໃນເວລາຈິງຫຼືໄວກວ່າໃນ GPU. ສະຖາປັດຕະຍະກໍາ end-to-end ຂອງມັນຫຼີກເວັ້ນຂັ້ນຕອນການປຸງແຕ່ງຫຼາຍຄັ້ງຂອງແບບອື່ນໆ, ເຊິ່ງແມ່ນເຫດຜົນທີ່ VITS ແມ່ນ ເໝາະ ສົມກັບການສັງເຄາະ batch ແລະ ຂະ ໜາດ ໃຫຍ່.

ບໍ່, VITS ບໍ່ສະໜັບສະໜູນການກັ່ນຕອງສຽງແບບຄລາສສິກໄດ້ເລີຍ. ມັນໃຊ້ແບບຟອມຜູ້ເວົ້າຫຼາຍຄົນທີ່ໄດ້ຮຽນມາກ່ອນ ແທນທີ່ຈະຄລາສສິກສຽງທີ່ໄດ້ມາຈາກຕົວຢ່າງທີ່ໄດ້ມາກ່ອນ. ສຳລັບການກັ່ນຕອງສຽງແບບຄລາສສິກໃນ TextToSpeechAI, ໃຊ້ F5- TTS ຫຼື GPT- SoVITS ແທນທີ່ຈະໃຊ້ມັນ.

VITS ຜະລິດສຽງທີ່ມີຄຸນນະພາບດີດ້ວຍສຽງທໍາມະຊາດແລະຈັງຫວະ. ໃນຂະນະທີ່ມັນບໍ່ຢູ່ໃນລະດັບຂອງ StyleTTS2ຫຼື Tortoise, ມັນສະ ເໜີ ຄຸນນະພາບທີ່ດີ ສຳ ລັບຄວາມໄວຂອງມັນ, ໂດຍສະເພາະ ສຳ ລັບການປະມວນຜົນ batch.

VITS ແມ່ນມີປະສິດທິພາບໃນຄວາມຈໍາ, ໂດຍປົກກະຕິແລ້ວຕ້ອງການພຽງແຕ່ GB ບາງ GB ຂອງ VRAM (ປະມານ 4GB). ມັນແລ່ນໄດ້ສະດວກສະບາຍໃນ GPUs ຂອງລູກຄ້າ, ແລະໃນ TextToSpeechAI ການສະແດງທັງຫມົດເກີດຂື້ນໃນເຊີບເວີຂອງພວກເຮົາດັ່ງນັ້ນທ່ານບໍ່ຕ້ອງການຮາດແວໃດໆຂອງຕົວທ່ານເອງ.

VITS ແລະ Piper ແມ່ນທັງສອງໄວ, MIT- ໃບອະນຸຍາດມາດຕະຖານ- ຊັ້ນເຄື່ອງຈັກໃນ TextToSpeechAI. Piper ແມ່ນທາງເລືອກທີ່ເບົາທີ່ສຸດ ແລະ ໄວທີ່ສຸດ, ໃນຂະນະທີ່ VITS ສະຫນອງໄອຄອນຫຼາຍໂຕທີ່ໃຫຍ່ (ລວມທັງ VCTK) ທີ່ມີການເວົ້າທີ່ເປັນທໍາມະຊາດຫຼາຍກວ່າເລັກນ້ອຍ. ບໍ່ມີການສະໜັບສະໜູນການກັ່ນຕອງສຽງໃດໆ.

VITS ແມ່ນເຄື່ອງຈັກມາດຕະຖານ-ຊັ້ນ, ຄ່າໃຊ້ຈ່າຍ 10 ເຄຣດິດຕໍ່ 1000 ຕົວອັກສອນ. ນີ້ແມ່ນຊັ້ນລາຄາຕ່ໍາທີ່ສຸດຂອງພວກເຮົາຂໍຂອບໃຈກັບປະສິດທິພາບ, ໄວທໍາມະຊາດຂອງແບບ VITS.

VITS ສ້າງສຽງທີ່ 22050Hz ທໍາມະຊາດ. ຜ່ານ TextToSpeechAI ທ່ານສາມາດຮ້ອງຂໍ MP3, WAV, ຫຼື OGG ຮູບແບບ, ກັບການປ່ຽນແປງອັດຕະໂນມັດຈັດການສໍາລັບທ່ານ.

ລົງທະບຽນໃນ TextToSpeechAI ເພື່ອໄດ້ຮັບເງິນຝາກເລີ່ມຕົ້ນຟຣີ, ຫຼັງຈາກນັ້ນເລືອກສຽງ VITS, ເຂົ້າສູ່ລະບົບຂໍ້ຄວາມຂອງທ່ານ, ແລະສ້າງສຽງ. ທ່ານຍັງສາມາດໃຊ້ການສະແດງເພື່ອຟັງ VITS ກ່ອນທີ່ຈະສ້າງບັນຊີ, ແລະເຂົ້າເຖິງ VITS ຜ່ານ REST API ຂອງພວກເຮົາເມື່ອທ່ານລົງທະບຽນ.

Technical Specs

Generation Speed Very Fast
Output Quality Good
Voice Cloning Not Supported
Languages 10
GPU VRAM 1-2GB
Credits/1000 chars 10

Try ວີທີສName Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

ວີ​ທີ​ສName

ກ່ຽວ​ກັບ ວີ​ທີ​ສName

ຄຸນ​ສົມບັດ​ຫຼັກ

ການ​ສັງເຄາະ​ໄວ

ການ​ປະມວນຜົນ​ແບດ

ເວົ້າ​ແບບ​ທໍາມະຊາດ

ຫຼາຍ​ໄມໂຄຣໂຟນ

ປະສິດທິພາບ

ແຫຼ່ງ​ເປີດ

ກໍລະນີ​ໃຊ້

ວີ​ທີ​ສName Voices

LJSpeech (English Female)

VCTK Speaker 225 (English Female)

VCTK Speaker 226 (English Male)

VCTK Speaker 227 (English Male)

VCTK Speaker 228 (English Female)

VCTK Speaker 229

VCTK Speaker 230

VCTK Speaker 231

VCTK Speaker 232

VCTK Speaker 233

VCTK Speaker 234

VCTK Speaker 236

ວິທີການ​ໃຊ້ ວີ​ທີ​ສName

ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo

ເລືອກ​ສຽງ ຫຼື ໄມໂຄຣໂຟນ VITS

បញ្ចូល​ຂໍ້ຄວາມ​ຂອງ​ທ່ານ

ສ້າງ​ສຽງ

ດາວໂຫລດ ຫຼື ໃຊ້ API

ວີ​ທີ​ສName API

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

VITS TTS ແມ່ນຫຍັງ?

VITS ແມ່ນຟຣີສຳລັບການໃຊ້ໃນການຄ້າບໍ?

ມີສຽງ VITS ເທົ່າໃດ?

VITS ສະໜັບສະໜູນພາສາໃດ?

VITS ໄວປານໃດ?

VITS ສະໜັບສະໜູນ​ການ​ກັ່ນຕອງ​ສຽງ​ບໍ?

ຄຸນນະພາບສຽງຂອງ VITS ແມ່ນຫຍັງ?

VITS ຕ້ອງການ​ຄວາມ​ຈຳ GPU ເທົ່າ​ໃດ?

VITS versus Piper: ອັນໃດທີ່ຂ້ອຍຄວນໃຊ້?

ຄ່າໃຊ້ຈ່າຍຂອງ VITS ສຳລັບ TextToSpeechAI ແມ່ນເທົ່າໃດ?

ຮູບແບບສຽງໃດທີ່ VITS ສົ່ງອອກ?

ຂ້ອຍຈະທົດລອງໃຊ້ VITS ຟຣີໄດ້ແນວໃດ?

Technical Specs

Try ວີ​ທີ​ສName Now

Other TTS Engines

​ក្រឡា​ចត្រង្គ

​ Chatterbox

ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name

ວີທີສName

ກ່ຽວກັບ ວີທີສName

ຄຸນສົມບັດຫຼັກ

ການສັງເຄາະໄວ

ການປະມວນຜົນແບດ

ເວົ້າແບບທໍາມະຊາດ

ຫຼາຍໄມໂຄຣໂຟນ

ແຫຼ່ງເປີດ

ກໍລະນີໃຊ້

ວີທີສName Voices

ວິທີການໃຊ້ ວີທີສName

ເລືອກສຽງ ຫຼື ໄມໂຄຣໂຟນ VITS

បញ្ចូលຂໍ້ຄວາມຂອງທ່ານ

ສ້າງສຽງ

ວີທີສName API

Try ວີທີສName Now

ក្រឡាចត្រង្គ

Chatterbox

ສຽງທີ່ສະດວກສະບາຍ2Name