ໂຄໂຣ

Standard

ໄວຄືໄຟ, TTS ເບົາກັບຄຸນນະພາບທໍາມະຊາດ

Very Fast ໄວ

Good ຄຸນນະພາບ

ບໍ່ໄດ້ ក្លូន

9 ພາສາ

ກ່ຽວກັບ ໂຄໂຣ

82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters in the world. Kokoro is the first TTS model to support 82M parameters in the world.

ຄຸນສົມບັດຫຼັກ

ງ່າຍສຸດ

82M ພາຣາມິເຕີ, ~300MB ຂະຫນາດແບບ. ແລ່ນໃນ CPU ກັບຊັບພະຍາກອນຕ່ໍາສຸດ.

ໃກ້ກັບເວລາຈິງ

ສ້າງການເວົ້າໄວກວ່າຄວາມໄວການຫຼິ້ນ, ເຖິງແມ່ນບໍ່ມີການເພີ່ມຄວາມໄວ GPU.

ພາສາຫຼາຍພາສາ

ສະໜັບສະໜູນພາສາອັງກິດ, ຝຣັ່ງ, ສະເປນ, ຮິນດີ, ຍີ່ປຸ່ນ, ຈີນ, ອີຕາລີ, ໂປຕຸເກດ, ແລະ ເກົາຫຼີ.

ສຽງປະສົມ

ລວມສຽງສອງສຽງເຂົ້າກັນ ເພື່ອສ້າງສຽງທີ່ມີເອກະລັກສະເພາະ

ກໍລະນີໃຊ້

ສົນທະນາແບບຈິງເວລາ ແລະ ຕົວຊ່ວຍແບບເສມືນ ສົ່ງຂໍ້ຄວາມໄປສູ່ການເວົ້າແບບສະໝໍ່າສະເຫມີ ຈັດການໂປແກຼມມືຖື ການປະມວນຜົນຫຼາຍຄັ້ງ

ວິທີການໃຊ້ ໂຄໂຣ

1

ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo

ສ້າງບັນຊີ TextToSpeechAI ຟຣີ ເພື່ອໄດ້ຮັບ 200 credits ເລີ່ມຕົ້ນ, ຫຼືໃຊ້ການສະແດງທີ່ບໍ່ລົງທະບຽນເພື່ອຟັງ Kokoro ທັນທີ. ລະດັບມາດຕະຖານ ໝາຍຄວາມວ່າ Kokoro ພຽງແຕ່ຄ່າໃຊ້ຈ່າຍ 10 credits ຕໍ່ 1000 ຕົວອັກສອນ.
2

ເລືອກສຽງ Kokoro

ເປີດຕົວທ່ອງເວັບສຽງ ແລະ ເລືອກສຽງ Kokoro ໃນພາສາເປົ້າໝາຍຂອງທ່ານ (9 ຖືກສະໜັບສະໜູນ, ຈາກພາສາອັງກິດໄປຫາພາສາຍີ່ປຸ່ນ ແລະ ພາສາເກົາຫຼີ). ທ່ານຍັງສາມາດໃຊ້ການປະສົມສຽງ Kokoro ເພື່ອປະສົມສຽງສອງສຽງເຂົ້າກັນເປັນການປະສົມແບບຕົວເລືອກໄດ້ອີກດ້ວຍ.
3

បញ្ចូលຂໍ້ຄວາມຂອງທ່ານ

ພິມ ຫຼື ປ້າຍ ຂໍ້ຄວາມທີ່ທ່ານຕ້ອງການເວົ້າເຂົ້າໄປໃນຕົວຈັດການຂໍ້ຄວາມ. Kokoro ຈັດການກັບຂໍ້ຄວາມຍາວໆຢ່າງມີປະສິດທິຜົນ ຂໍຂອບໃຈກັບການໃຊ້ງານງ່າຍໆ 82M-parameters, ໃກ້ກັບເຄື່ອງຈັກເວລາຈິງ.
4

ປັບຄວາມໄວ ແລະ ສ້າງ

ຕັ້ງຄວາມໄວການຫຼິ້ນໃຫ້ເໝາະສົມກັບການໃຊ້ງານຂອງທ່ານ, ຈາກນັ້ນຄລິກໃສ່ ສ້າງ. Kokoro ສະແດງສຽງໄວກວ່າເວລາຈິງ, ສະນັ້ນການເວົ້າຂອງທ່ານຈະພ້ອມທັນທີ.
5

ດາວໂຫລດ ຫຼື ໃຊ້ API

ດາວໂຫລດສຽງທີ່ສໍາເລັດເປັນ MP3 ຫຼື WAV, ຫຼືອັດຕະໂນມັດການຜະລິດຜ່ານ TextToSpeechAI REST API ທີ່ api.texttospeechai.com ສໍາລັບ batch ແລະ real-time ວຽກ.

ໂຄໂຣ API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro ສົ່ງການເວົ້າທີ່ທໍາມະຊາດດ້ວຍຄວາມໄວ ແລະ ປະສິດທິພາບທີ່ຫນ້າເຊື່ອຖື.",
    "voice": "en_US-lessac-medium"
  }'

ອ່ານເອກະສານ API ເອົາກຸນແຈ API ຂອງທ່ານ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Kokoro ແມ່ນແບບແບບທີ່ໃຊ້ການແປຂໍ້ຄວາມເປັນຄຳເວົ້າທີ່ເບົາຫຼາຍທີ່ສຸດທີ່ມີພຽງແຕ່ຕົວກຳນົດຄ່າ 82 ລ້ານຕົວເທົ່ານັ້ນ. ເຖິງແມ່ນຈະມີຂະໜາດນ້ອຍກໍຕາມ, ມັນຍັງສາມາດແປຄຳເວົ້າທີ່ມີສຽງທໍາມະຊາດຜ່ານພາສາຫຼາຍພາສາໄດ້ດ້ວຍຄວາມໄວທີ່ໃກ້ຄຽງກັບເວລາຈິງ, ເຖິງແມ່ນຈະໃຊ້ CPU ຫຼາຍກໍ່ຕາມ.

ແມ່ນແລ້ວ, Kokoro ແມ່ນໄດ້ຮັບອະນຸຍາດ Apache 2.0 ຢ່າງເຕັມທີ່ - ທັງໂປຣແກຣມແລະນໍ້າ ໜັກ ແບບ. ມັນສາມາດໃຊ້ໄດ້ໂດຍບໍ່ເສຍຄ່າໃນໂປແກຼມການຄ້າໂດຍບໍ່ຕ້ອງຈໍາກັດ.

Kokoro ສະໜັບສະໜູນພາສາອັງກິດ (ສະຫະລັດ ແລະ ບຣາຊິນ), ຝຣັ່ງ, ສະເປນ, ຮິນດີ, ຍີ່ປຸ່ນ, ຈີນ, ອີຕາລີ, ໂປຣຕຸເກດ ແລະ ເກົາຫຼີ.

Kokoro ແມ່ນໜຶ່ງໃນແບບແບບ TTS ທີ່ໄວທີ່ສຸດທີ່ມີຢູ່. ມັນສ້າງການເວົ້າໄວກວ່າຄວາມໄວການຫຼິ້ນເວລາຈິງ ເຖິງແມ່ນຢູ່ໃນ CPU, ເຮັດໃຫ້ມັນດີເລີດສຳລັບການໃຊ້ງານແບບໂຕ້ຕອບ.

ບໍ່, Kokoro ບໍ່ສະໜັບສະໜູນການຖ່າຍແບບສຽງແບບຄລາສສິກໄດ້ເລີຍ. ມັນໃຊ້ຫໍສະໝຸດສຽງທີ່ໄດ້ຈັດຕັ້ງໄວ້ແລ້ວພ້ອມກັບຄວາມສາມາດໃນການປະສົມສຽງກັນ. ສຳລັບການຖ່າຍແບບສຽງແບບຄລາສສິກ, ໃຊ້ F5- TTS, Chatterbox, StyleTTS2, OpenVoice, ຫຼື Tortoise.

Kokoro ສາມາດປະສົມສຽງສອງສຽງເຂົ້າກັນເພື່ອສ້າງການປະສົມທີ່ມີເອກະລັກສະເພາະໄດ້. ສິ່ງນີ້ອະນຸຍາດໃຫ້ທ່ານສ້າງຄຸນລັກສະນະສຽງຕາມໃຈເອງໂດຍບໍ່ຕ້ອງມີການກັ່ນຕອງສຽງແບບເກົ່າອີກຕໍ່ໄປ.

ທັງສອງແມ່ນໄວ, ແບບງ່າຍ. Kokoro ມີສະຖາປັດຕະຍະກໍາທີ່ທັນສະໄຫມກວ່າແລະສະຫນັບສະຫນູນການປະສົມສຽງ, ໃນຂະນະທີ່ Piper ມີຫໍສະໝຸດສຽງທີ່ໃຫຍ່ກວ່າ. ທັງສອງແມ່ນດີ ສຳ ລັບການປະມວນຜົນເວລາຈິງ.

Kokoro ຖືກອອກແບບມາເພື່ອແລ່ນໃນ CPU ແລະຕ້ອງການຊັບພະຍາກອນທີ່ນ້ອຍທີ່ສຸດ - ປະມານ 300MB. ບໍ່ມີ GPU ທີ່ຕ້ອງການ, ເຖິງວ່າຈະມີການເພີ່ມຄວາມໄວ GPU ທີ່ຈະໄດ້ຮັບການສະໜັບສະໜູນສໍາລັບການປະມວນຜົນທີ່ໄວກວ່າ.

Kokoro ສ້າງການເວົ້າໄວກວ່າການຫຼິ້ນເຖິງແມ່ນວ່າໃນ CPU, ທີ່ມີ latency ຕ່ໍາ, ສະນັ້ນມັນເຫມາະສົມສໍາລັບ chatbots, ຜູ້ຊ່ວຍສຽງ, ແລະສື່ມວນຊົນສົດ. ຂະຫນາດ 82M-parameter ຂອງຕົນຮັກສາການໃຊ້ຄວາມຈໍານ້ອຍ, ເຮັດໃຫ້ມັນເປັນໄປໄດ້ສໍາລັບຂະຫນາດສູງແລະ Edge ການນໍາໃຊ້.

ການປະສົມສຽງອະນຸຍາດໃຫ້ທ່ານປະສົມສຽງ Kokoro ສອງສຽງເຂົ້າກັນເພື່ອສ້າງການປະສົມທີ່ມີເອກະລັກສະເພາະດ້ວຍຄຸນລັກສະນະທີ່ໄດ້ກຳນົດໄວ້ລ່ວງໜ້າ. ມັນບໍ່ແມ່ນການປະສົມສຽງແບບປະເພນີ - ທ່ານບໍ່ສາມາດຜະລິດຄົນສະເພາະຈາກຕົວຢ່າງ - ແຕ່ມັນໃຫ້ທ່ານມີຄວາມຫຼາກຫຼາຍຫຼາຍກວ່າຫໍສະໝຸດສຽງທີ່ບໍ່ປ່ຽນແປງ. ທ່ານສາມາດທົດລອງປະສົມສຽງໂດຍກົງໃນຕົວຈັດການ TextToSpeechAI.

ສອງຢ່າງນີ້ແມ່ນໄວ, CPU- ທີ່ເປັນມິດມາດຕະຖານ- ຊັ້ນເຄື່ອງຈັກໂດຍບໍ່ມີການກັ່ນຕອງສຽງ. Kokoro ແມ່ນເບົາທີ່ສຸດ (ປະມານ 300MB) ແລະ ສະຫນັບສະຫນູນການປະສົມສຽງຜ່ານພາສາ9ພາສາ, ໃນຂະນະທີ່ MeloTTS ສຸມໃສ່ຫຼາຍພາສາອັງກິດຫຼາຍແລະເວລາຈິງຫຼາຍພາສາອອກຜົນ. ເລືອກ Kokoro ສໍາລັບ footprint ນ້ອຍທີ່ສຸດແລະ blending; ເລືອກ MeloTTS ເມື່ອທ່ານຕ້ອງການ accents ສະເພາະ.

Kokoro ແມ່ນເຄື່ອງທີ່ມີລະດັບມາດຕະຖານ, ຄ່າໃຊ້ຈ່າຍ 10 ເຄຣດິດຕໍ່ຕົວອັກສອນ 1000 - ລະດັບຕ່ຳສຸດທີ່ TextToSpeechAI. ບັນຊີໃໝ່ຈະໄດ້ຮັບ 200 ເຄຣດິດຟຣີ, ສະນັ້ນທ່ານສາມາດທົດລອງໃຊ້ Kokoro ໂດຍບໍ່ຕ້ອງຈ່າຍຄ່າໃຊ້ຈ່າຍໃດໆ. ສິ່ງນີ້ເຮັດໃຫ້ມັນເປັນວິທີທີ່ມີຄ່າໃຊ້ຈ່າຍຕ່ຳທີ່ສຸດເພື່ອສ້າງການເວົ້າທີ່ມີຄຸນນະພາບສູງໃນຂະໜາດໃຫຍ່.

Technical Specs

Generation Speed Very Fast
Output Quality Good
Voice Cloning Not Supported
Languages 9
GPU VRAM CPU OK
Credits/1000 chars 10

Try ໂຄໂຣ Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

ໂຄໂຣ

ກ່ຽວ​ກັບ ໂຄໂຣ

ຄຸນ​ສົມບັດ​ຫຼັກ

ງ່າຍ​ສຸດ

ໃກ້​ກັບ​ເວລາ​ຈິງ

ພາສາ​ຫຼາຍ​ພາສາ

ສຽງ​ປະສົມ

ກໍລະນີ​ໃຊ້

ວິທີການ​ໃຊ້ ໂຄໂຣ

ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo

ເລືອກ​ສຽງ Kokoro

បញ្ចូល​ຂໍ້ຄວາມ​ຂອງ​ທ່ານ

ປັບ​ຄວາມ​ໄວ ແລະ ສ້າງ

ດາວໂຫລດ ຫຼື ໃຊ້ API

ໂຄໂຣ API

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Kokoro TTS ແມ່ນຫຍັງ?

Kokoro ແມ່ນຟຣີທີ່ຈະໃຊ້ໃນການຄ້າບໍ?

Kokoro ສະໜັບສະໜູນພາສາໃດ?

Kokoro ໄວປານໃດ?

Kokoro ສະໜັບສະໜູນ​ການ​ກັ່ນຕອງ​ສຽງ​ບໍ?

ສຽງ​ປະສົມ​ແມ່ນ​ຫຍັງ?

ໂຄໂຣໂຣ ຄືແນວໃດເມື່ອທຽບກັບ ປາເປຣ?

Kokoro ຕ້ອງການ​ຄວາມ​ຈຳ GPU ເທົ່າ​ໃດ?

Kokoro ດີສຳລັບແອັບພລິເຄຊັນທີ່ໃຊ້ເວລາຈິງບໍ?

ສຽງ Kokoro ປະກອບກັນແມ່ນຫຍັງ?

Kokoro versus MeloTTS - ອັນໃດທີ່ຂ້ອຍຄວນໃຊ້?

ຈຳນວນເງິນທີ່ Kokoro ໃຊ້ໃນ TextToSpeechAI ແມ່ນເທົ່າໃດ?

Technical Specs

Try ໂຄໂຣ Now

Other TTS Engines

​ក្រឡា​ចត្រង្គ

​ Chatterbox

ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name

ກ່ຽວກັບ ໂຄໂຣ

ຄຸນສົມບັດຫຼັກ

ງ່າຍສຸດ

ໃກ້ກັບເວລາຈິງ

ພາສາຫຼາຍພາສາ

ສຽງປະສົມ

ກໍລະນີໃຊ້

ວິທີການໃຊ້ ໂຄໂຣ

ເລືອກສຽງ Kokoro

បញ្ចូលຂໍ້ຄວາມຂອງທ່ານ

ປັບຄວາມໄວ ແລະ ສ້າງ

ក្រឡាចត្រង្គ

Chatterbox

ສຽງທີ່ສະດວກສະບາຍ2Name