ກ່ຽວກັບ ໂຄໂຣ
82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters in the world. Kokoro is the first TTS model to support 82M parameters in the world.
ຄຸນສົມບັດຫຼັກ
ງ່າຍສຸດ
82M ພາຣາມິເຕີ, ~300MB ຂະຫນາດແບບ. ແລ່ນໃນ CPU ກັບຊັບພະຍາກອນຕ່ໍາສຸດ.
ໃກ້ກັບເວລາຈິງ
ສ້າງການເວົ້າໄວກວ່າຄວາມໄວການຫຼິ້ນ, ເຖິງແມ່ນບໍ່ມີການເພີ່ມຄວາມໄວ GPU.
ພາສາຫຼາຍພາສາ
ສະໜັບສະໜູນພາສາອັງກິດ, ຝຣັ່ງ, ສະເປນ, ຮິນດີ, ຍີ່ປຸ່ນ, ຈີນ, ອີຕາລີ, ໂປຕຸເກດ, ແລະ ເກົາຫຼີ.
ສຽງປະສົມ
ລວມສຽງສອງສຽງເຂົ້າກັນ ເພື່ອສ້າງສຽງທີ່ມີເອກະລັກສະເພາະ
ກໍລະນີໃຊ້
ວິທີການໃຊ້ ໂຄໂຣ
-
1
ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo
ສ້າງບັນຊີ TextToSpeechAI ຟຣີ ເພື່ອໄດ້ຮັບ 200 credits ເລີ່ມຕົ້ນ, ຫຼືໃຊ້ການສະແດງທີ່ບໍ່ລົງທະບຽນເພື່ອຟັງ Kokoro ທັນທີ. ລະດັບມາດຕະຖານ ໝາຍຄວາມວ່າ Kokoro ພຽງແຕ່ຄ່າໃຊ້ຈ່າຍ 10 credits ຕໍ່ 1000 ຕົວອັກສອນ.
-
2
ເລືອກສຽງ Kokoro
ເປີດຕົວທ່ອງເວັບສຽງ ແລະ ເລືອກສຽງ Kokoro ໃນພາສາເປົ້າໝາຍຂອງທ່ານ (9 ຖືກສະໜັບສະໜູນ, ຈາກພາສາອັງກິດໄປຫາພາສາຍີ່ປຸ່ນ ແລະ ພາສາເກົາຫຼີ). ທ່ານຍັງສາມາດໃຊ້ການປະສົມສຽງ Kokoro ເພື່ອປະສົມສຽງສອງສຽງເຂົ້າກັນເປັນການປະສົມແບບຕົວເລືອກໄດ້ອີກດ້ວຍ.
-
3
បញ្ចូលຂໍ້ຄວາມຂອງທ່ານ
ພິມ ຫຼື ປ້າຍ ຂໍ້ຄວາມທີ່ທ່ານຕ້ອງການເວົ້າເຂົ້າໄປໃນຕົວຈັດການຂໍ້ຄວາມ. Kokoro ຈັດການກັບຂໍ້ຄວາມຍາວໆຢ່າງມີປະສິດທິຜົນ ຂໍຂອບໃຈກັບການໃຊ້ງານງ່າຍໆ 82M-parameters, ໃກ້ກັບເຄື່ອງຈັກເວລາຈິງ.
-
4
ປັບຄວາມໄວ ແລະ ສ້າງ
ຕັ້ງຄວາມໄວການຫຼິ້ນໃຫ້ເໝາະສົມກັບການໃຊ້ງານຂອງທ່ານ, ຈາກນັ້ນຄລິກໃສ່ ສ້າງ. Kokoro ສະແດງສຽງໄວກວ່າເວລາຈິງ, ສະນັ້ນການເວົ້າຂອງທ່ານຈະພ້ອມທັນທີ.
-
5
ດາວໂຫລດ ຫຼື ໃຊ້ API
ດາວໂຫລດສຽງທີ່ສໍາເລັດເປັນ MP3 ຫຼື WAV, ຫຼືອັດຕະໂນມັດການຜະລິດຜ່ານ TextToSpeechAI REST API ທີ່ api.texttospeechai.com ສໍາລັບ batch ແລະ real-time ວຽກ.
ໂຄໂຣ API
ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro ສົ່ງການເວົ້າທີ່ທໍາມະຊາດດ້ວຍຄວາມໄວ ແລະ ປະສິດທິພາບທີ່ຫນ້າເຊື່ອຖື.",
"voice": "en_US-lessac-medium"
}'
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10