ວີທີສName
Standardໄວສຸດທ້າຍເຖິງສຸດທ້າຍ TTS ກັບການເວົ້າທໍາມະຊາດ
ກ່ຽວກັບ ວີທີສName
-efficient, and highly-efficient TTS model. It is designed to be used in the field of text-to-speech, and is based on the
ຄຸນສົມບັດຫຼັກ
ການສັງເຄາະໄວ
ໂຄງສ້າງພື້ນຖານ End-to-end ເພື່ອສ້າງການເວົ້າຢ່າງໄວວາ.
ການປະມວນຜົນແບດ
ຈັດການຂໍ້ຄວາມຫຼາຍຢ່າງໃນເວລາດຽວກັນຢ່າງມີປະສິດທິຜົນ.
ເວົ້າແບບທໍາມະຊາດ
ການຝຶກ VAE+GAN ເຮັດໃຫ້ເກີດການເວົ້າ ແລະ ຮ້ອງເພງແບບທຳມະຊາດ.
ຫຼາຍໄມໂຄຣໂຟນ
ແບບດຽວນີ້ຮອງຮັບສຽງຫຼາຍຄົນ
ປະສິດທິພາບ
ໃຊ້ພື້ນທີ່ໃນສະໝອງຕ່ຳກັບປະສິດທິພາບທີ່ດີ.
ແຫຼ່ງເປີດ
MIT ອະນຸຍາດໃຫ້ໃຊ້ໄດ້ທຸກກໍລະນີ
ກໍລະນີໃຊ້
ວີທີສName Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENວິທີການໃຊ້ ວີທີສName
-
1
ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo
ສ້າງບັນຊີ TextToSpeechAI ໂດຍບໍ່ເສຍຄ່າ ເພື່ອໄດ້ຮັບເງິນກູ້ເລີ່ມຕົ້ນ, ຫຼືໃຊ້ການສະແດງໃນ ໜ້າ ເພື່ອຟັງ VITS ກ່ອນທີ່ຈະລົງທະບຽນ.
-
2
ເລືອກສຽງ ຫຼື ໄມໂຄຣໂຟນ VITS
ຄົ້ນຫາຫໍສະໝຸດສຽງ ແລະ ເລືອກສຽງທີ່ໄດ້ສະແດງດ້ວຍປ້າຍສະແດງຊື່ VITS. ຫໍສະໝຸດ VITS ທີ່ມີຫຼາຍເຄື່ອງເວົ້າ, ລວມທັງຊຸດເຄື່ອງເວົ້າ VCTK, ອະນຸຍາດໃຫ້ທ່ານເລືອກສຽງທີ່ແຕກຕ່າງກັນຫຼາຍຢ່າງ.
-
3
បញ្ចូលຂໍ້ຄວາມຂອງທ່ານ
ພິມ ຫຼື ບິດຂໍ້ຄວາມທີ່ທ່ານຕ້ອງການເວົ້າເຂົ້າໃນຕົວຈັດການຂໍ້ຄວາມ. VITS ຈັດການກັບຂໍ້ຄວາມຍາວໄດ້ດີ ແລະ ດີທີ່ສຸດສຳລັບເນື້ອໃນຫຼາຍໆອັນ ແລະ ເນື້ອໃນທີ່ມີປະລິມານສູງ.
-
4
ສ້າງສຽງ
ກົດເພື່ອສ້າງການເວົ້າດ້ວຍ VITS. ຍ້ອນວ່າ VITS ໄວຫຼາຍ ແລະ ມາດຕະຖານລະດັບ (10 ຄະແນນຕໍ່ 1000 ຕົວອັກສອນ), ຜົນໄດ້ຮັບກັບຄືນໄວໃນລາຄາຕ່ຳ.
-
5
ດາວໂຫລດ ຫຼື ໃຊ້ API
ດາວໂຫລດສຽງທີ່ສໍາເລັດເປັນ MP3, WAV, ຫຼື OGG, ຫຼືໂທຫາສຽງ VITS ດຽວກັນຜ່ານ TextToSpeechAI REST API ເພື່ອຜະລິດອັດຕະໂນມັດໃນໂປແກຼມຂອງທ່ານເອງ.
ວີທີສName API
ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS ສົ່ງໃຫ້ໄວ, ເວົ້າທໍາມະຊາດສໍາລັບການໃຊ້ງານທີ່ມີປະລິມານສູງ.",
"voice": "vits-ljspeech"
}'
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10