ໂຄໂຣ

Standard

ໄວ​ຄື​ໄຟ, TTS ເບົາ​ກັບ​ຄຸນ​ນະ​ພາບ​ທໍາມະ​ຊາດ

Very Fast ໄວ
Good ຄຸນນະພາບ
​ບໍ່​ໄດ້​ ​ក្លូន
9 ພາສາ

ກ່ຽວ​ກັບ ໂຄໂຣ

82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters in the world. Kokoro is the first TTS model to support 82M parameters in the world.

ຄຸນ​ສົມບັດ​ຫຼັກ

ງ່າຍ​ສຸດ

82M ພາຣາມິເຕີ, ~300MB ຂະຫນາດແບບ. ແລ່ນໃນ CPU ກັບຊັບພະຍາກອນຕ່ໍາສຸດ.

ໃກ້​ກັບ​ເວລາ​ຈິງ

ສ້າງ​ການ​ເວົ້າ​ໄວ​ກວ່າ​ຄວາມ​ໄວ​ການ​ຫຼິ້ນ, ເຖິງ​ແມ່ນ​ບໍ່ມີ​ການ​ເພີ່ມ​ຄວາມ​ໄວ GPU.

ພາສາ​ຫຼາຍ​ພາສາ

ສະໜັບສະໜູນພາສາອັງກິດ, ຝຣັ່ງ, ສະເປນ, ຮິນດີ, ຍີ່ປຸ່ນ, ຈີນ, ອີຕາລີ, ໂປຕຸເກດ, ແລະ ເກົາຫຼີ.

ສຽງ​ປະສົມ

ລວມ​ສຽງ​ສອງ​ສຽງ​ເຂົ້າ​ກັນ ເພື່ອ​ສ້າງ​ສຽງ​ທີ່​ມີ​ເອກະລັກ​ສະເພາະ​

ກໍລະນີ​ໃຊ້

ສົນທະນາ​ແບບ​ຈິງ​ເວລາ ແລະ ຕົວຊ່ວຍ​ແບບ​ເສມືນ ສົ່ງຂໍ້ຄວາມ​ໄປ​ສູ່​ການ​ເວົ້າ​ແບບ​ສະໝໍ່າສະເຫມີ ຈັດການ​ໂປແກຼມ​ມືຖື ການ​ປະມວນຜົນ​ຫຼາຍ​ຄັ້ງ​

ວິທີການ​ໃຊ້ ໂຄໂຣ

  1. 1

    ລົງທະບຽນຟຣີ ຫຼື ທົດລອງໃຊ້ Demo

    ສ້າງບັນຊີ TextToSpeechAI ຟຣີ ເພື່ອໄດ້ຮັບ 200 credits ເລີ່ມຕົ້ນ, ຫຼືໃຊ້ການສະແດງທີ່ບໍ່ລົງທະບຽນເພື່ອຟັງ Kokoro ທັນທີ. ລະດັບມາດຕະຖານ ໝາຍຄວາມວ່າ Kokoro ພຽງແຕ່ຄ່າໃຊ້ຈ່າຍ 10 credits ຕໍ່ 1000 ຕົວອັກສອນ.

  2. 2

    ເລືອກ​ສຽງ Kokoro

    ເປີດ​ຕົວ​ທ່ອງ​ເວັບ​ສຽງ ແລະ ເລືອກ​ສຽງ Kokoro ໃນ​ພາສາ​ເປົ້າ​ໝາຍ​ຂອງທ່ານ (9 ຖືກ​ສະໜັບສະໜູນ, ຈາກ​ພາສາ​ອັງກິດ​ໄປ​ຫາ​ພາສາ​ຍີ່ປຸ່ນ ແລະ ພາສາ​ເກົາຫຼີ). ທ່ານ​ຍັງ​ສາມາດ​ໃຊ້​ການ​ປະສົມ​ສຽງ Kokoro ເພື່ອ​ປະສົມ​ສຽງ​ສອງ​ສຽງ​ເຂົ້າ​ກັນ​ເປັນ​ການ​ປະສົມ​ແບບ​ຕົວ​ເລືອກ​ໄດ້​ອີກ​ດ້ວຍ.

  3. 3

    បញ្ចូល​ຂໍ້ຄວາມ​ຂອງ​ທ່ານ

    ພິມ ຫຼື ປ້າຍ ຂໍ້ຄວາມທີ່​ທ່ານ​ຕ້ອງການ​ເວົ້າ​ເຂົ້າ​ໄປ​ໃນ​ຕົວ​ຈັດການ​ຂໍ້ຄວາມ. Kokoro ຈັດການ​ກັບ​ຂໍ້​ຄວາມ​ຍາວໆ​ຢ່າງ​ມີ​ປະສິດ​ທິ​ຜົນ ຂໍ​ຂອບໃຈ​ກັບ​ການ​ໃຊ້​ງານ​ງ່າຍໆ 82M-parameters, ໃກ້​ກັບ​ເຄື່ອງຈັກ​ເວລາ​ຈິງ.

  4. 4

    ປັບ​ຄວາມ​ໄວ ແລະ ສ້າງ

    ຕັ້ງ​ຄວາມ​ໄວ​ການ​ຫຼິ້ນ​ໃຫ້​ເໝາະສົມ​ກັບ​ການ​ໃຊ້​ງານ​ຂອງ​ທ່ານ, ຈາກນັ້ນ​ຄລິກ​ໃສ່ ສ້າງ. Kokoro ສະແດງ​ສຽງ​ໄວ​ກວ່າ​ເວລາ​ຈິງ, ສະນັ້ນ​ການ​ເວົ້າ​ຂອງທ່ານ​ຈະ​ພ້ອມ​ທັນທີ.

  5. 5

    ດາວໂຫລດ ຫຼື ໃຊ້ API

    ດາວໂຫລດສຽງທີ່ສໍາເລັດເປັນ MP3 ຫຼື WAV, ຫຼືອັດຕະໂນມັດການຜະລິດຜ່ານ TextToSpeechAI REST API ທີ່ api.texttospeechai.com ສໍາລັບ batch ແລະ real-time ວຽກ.

ໂຄໂຣ API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro ສົ່ງການເວົ້າທີ່ທໍາມະຊາດດ້ວຍຄວາມໄວ ແລະ ປະສິດທິພາບທີ່ຫນ້າເຊື່ອຖື.",
    "voice": "en_US-lessac-medium"
  }'

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Kokoro ແມ່ນ​ແບບ​ແບບ​ທີ່​ໃຊ້​ການ​ແປ​ຂໍ້​ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ​ທີ່​ເບົາ​ຫຼາຍ​ທີ່​ສຸດ​ທີ່​ມີ​ພຽງ​ແຕ່​ຕົວ​ກຳນົດ​ຄ່າ 82 ລ້ານ​ຕົວ​ເທົ່າ​ນັ້ນ. ເຖິງ​ແມ່ນ​ຈະ​ມີ​ຂະ​ໜາດ​ນ້ອຍ​ກໍ​ຕາມ, ມັນ​ຍັງ​ສາມາດ​ແປ​ຄຳ​ເວົ້າ​ທີ່​ມີ​ສຽງ​ທໍາມະ​ຊາດ​ຜ່ານ​ພາສາ​ຫຼາຍ​ພາສາ​ໄດ້​ດ້ວຍ​ຄວາມ​ໄວ​ທີ່​ໃກ້​ຄຽງ​ກັບ​ເວລາ​ຈິງ, ເຖິງ​ແມ່ນ​ຈະ​ໃຊ້ CPU ຫຼາຍ​ກໍ່ຕາມ.

ແມ່ນແລ້ວ, Kokoro ແມ່ນໄດ້ຮັບອະນຸຍາດ Apache 2.0 ຢ່າງເຕັມທີ່ - ທັງໂປຣແກຣມແລະນໍ້າ ໜັກ ແບບ. ມັນສາມາດໃຊ້ໄດ້ໂດຍບໍ່ເສຍຄ່າໃນໂປແກຼມການຄ້າໂດຍບໍ່ຕ້ອງຈໍາກັດ.

Kokoro ສະໜັບສະໜູນພາສາອັງກິດ (ສະຫະລັດ ແລະ ບຣາຊິນ), ຝຣັ່ງ, ສະເປນ, ຮິນດີ, ຍີ່ປຸ່ນ, ຈີນ, ອີຕາລີ, ໂປຣຕຸເກດ ແລະ ເກົາຫຼີ.

Kokoro ແມ່ນ​ໜຶ່ງ​ໃນ​ແບບ​ແບບ TTS ທີ່​ໄວ​ທີ່ສຸດ​ທີ່​ມີ​ຢູ່. ມັນ​ສ້າງ​ການ​ເວົ້າ​ໄວ​ກວ່າ​ຄວາມ​ໄວ​ການ​ຫຼິ້ນ​ເວລາ​ຈິງ ເຖິງ​ແມ່ນ​ຢູ່​ໃນ CPU, ເຮັດໃຫ້​ມັນ​ດີ​ເລີດ​ສຳລັບ​ການ​ໃຊ້​ງານ​ແບບ​ໂຕ້ຕອບ.

ບໍ່, Kokoro ບໍ່​ສະໜັບສະໜູນ​ການ​ຖ່າຍ​ແບບ​ສຽງ​ແບບ​ຄລາສສິກ​ໄດ້​ເລີຍ. ມັນ​ໃຊ້​ຫໍສະໝຸດ​ສຽງ​ທີ່​ໄດ້​ຈັດ​ຕັ້ງ​ໄວ້​ແລ້ວ​ພ້ອມ​ກັບ​ຄວາມສາມາດ​ໃນການ​ປະສົມ​ສຽງ​ກັນ. ສຳລັບ​ການ​ຖ່າຍ​ແບບ​ສຽງ​ແບບ​ຄລາສສິກ, ໃຊ້ F5- TTS, Chatterbox, StyleTTS2, OpenVoice, ຫຼື Tortoise.

Kokoro ສາມາດ​ປະສົມ​ສຽງ​ສອງ​ສຽງ​ເຂົ້າ​ກັນ​ເພື່ອ​ສ້າງ​ການ​ປະສົມ​ທີ່​ມີ​ເອກະລັກ​ສະເພາະ​ໄດ້. ສິ່ງນີ້​ອະນຸຍາດ​ໃຫ້​ທ່ານ​ສ້າງ​ຄຸນ​ລັກ​ສະ​ນະ​ສຽງ​ຕາມ​ໃຈ​ເອງ​ໂດຍ​ບໍ່​ຕ້ອງ​ມີ​ການ​ກັ່ນຕອງ​ສຽງ​ແບບ​ເກົ່າ​ອີກ​ຕໍ່ໄປ.

ທັງສອງແມ່ນໄວ, ແບບງ່າຍ. Kokoro ມີສະຖາປັດຕະຍະກໍາທີ່ທັນສະໄຫມກວ່າແລະສະຫນັບສະຫນູນການປະສົມສຽງ, ໃນຂະນະທີ່ Piper ມີຫໍສະໝຸດສຽງທີ່ໃຫຍ່ກວ່າ. ທັງສອງແມ່ນດີ ສຳ ລັບ​ການ​ປະມວນຜົນ​ເວລາຈິງ.

Kokoro ຖືກອອກແບບມາເພື່ອແລ່ນໃນ CPU ແລະຕ້ອງການຊັບພະຍາກອນທີ່ນ້ອຍທີ່ສຸດ - ປະມານ 300MB. ບໍ່ມີ GPU ທີ່ຕ້ອງການ, ເຖິງວ່າຈະມີການເພີ່ມຄວາມໄວ GPU ທີ່ຈະໄດ້ຮັບການສະໜັບສະໜູນສໍາລັບການປະມວນຜົນທີ່ໄວກວ່າ.

Kokoro ສ້າງການເວົ້າໄວກວ່າການຫຼິ້ນເຖິງແມ່ນວ່າໃນ CPU, ທີ່ມີ latency ຕ່ໍາ, ສະນັ້ນມັນເຫມາະສົມສໍາລັບ chatbots, ຜູ້ຊ່ວຍສຽງ, ແລະສື່ມວນຊົນສົດ. ຂະຫນາດ 82M-parameter ຂອງຕົນຮັກສາການໃຊ້ຄວາມຈໍານ້ອຍ, ເຮັດໃຫ້ມັນເປັນໄປໄດ້ສໍາລັບຂະຫນາດສູງແລະ Edge ການນໍາໃຊ້.

ການ​ປະສົມ​ສຽງ​ອະນຸຍາດ​ໃຫ້​ທ່ານ​ປະສົມ​ສຽງ​ Kokoro ສອງ​ສຽງ​ເຂົ້າ​ກັນ​ເພື່ອ​ສ້າງ​ການ​ປະສົມ​ທີ່​ມີ​ເອກະລັກ​ສະເພາະ​ດ້ວຍ​ຄຸນ​ລັກ​ສະ​ນະ​ທີ່​ໄດ້​ກຳນົດ​ໄວ້​ລ່ວງ​ໜ້າ. ມັນ​ບໍ່​ແມ່ນ​ການ​ປະສົມ​ສຽງ​ແບບ​ປະເພນີ - ທ່ານ​ບໍ່ສາມາດ​ຜະລິດ​ຄົນ​ສະເພາະ​ຈາກ​ຕົວຢ່າງ - ແຕ່​ມັນ​ໃຫ້​ທ່ານ​ມີ​ຄວາມ​ຫຼາກຫຼາຍ​ຫຼາຍ​ກວ່າ​ຫໍສະໝຸດ​ສຽງ​ທີ່​ບໍ່​ປ່ຽນແປງ. ທ່ານ​ສາມາດ​ທົດລອງ​ປະສົມ​ສຽງ​ໂດຍ​ກົງ​ໃນ​ຕົວ​ຈັດການ TextToSpeechAI.

ສອງ​ຢ່າງ​ນີ້​ແມ່ນ​ໄວ, CPU- ທີ່ເປັນມິດ​ມາດຕະຖານ- ຊັ້ນເຄື່ອງຈັກ​ໂດຍບໍ່ມີການ​ກັ່ນຕອງສຽງ. Kokoro ແມ່ນເບົາທີ່ສຸດ (ປະມານ 300MB) ແລະ ສະຫນັບສະຫນູນການ​ປະສົມ​ສຽງ​ຜ່ານ​ພາສາ9ພາສາ, ໃນຂະນະທີ່ MeloTTS ສຸມໃສ່​ຫຼາຍພາສາອັງກິດຫຼາຍແລະ​ເວລາ​ຈິງ​ຫຼາຍພາສາ​ອອກ​ຜົນ. ເລືອກ Kokoro ສໍາລັບ footprint ນ້ອຍທີ່ສຸດແລະ blending; ເລືອກ MeloTTS ເມື່ອທ່ານຕ້ອງການ accents ສະເພາະ.

Kokoro ແມ່ນ​ເຄື່ອງ​ທີ່​ມີ​ລະດັບ​ມາດຕະຖານ, ຄ່າ​ໃຊ້​ຈ່າຍ 10 ເຄຣດິດ​ຕໍ່​ຕົວ​ອັກສອນ 1000 - ລະດັບ​ຕ່ຳ​ສຸດ​ທີ່ TextToSpeechAI. ບັນຊີ​ໃໝ່​ຈະ​ໄດ້ຮັບ 200 ເຄຣດິດ​ຟຣີ, ສະນັ້ນ​ທ່ານ​ສາມາດ​ທົດລອງ​ໃຊ້ Kokoro ໂດຍບໍ່​ຕ້ອງ​ຈ່າຍ​ຄ່າ​ໃຊ້​ຈ່າຍ​ໃດໆ. ສິ່ງ​ນີ້​ເຮັດໃຫ້​ມັນ​ເປັນ​ວິທີ​ທີ່​ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ​ຕ່ຳ​ທີ່ສຸດ​ເພື່ອ​ສ້າງ​ການ​ເວົ້າ​ທີ່ມີ​ຄຸນ​ນະ​ພາບ​ສູງ​ໃນ​ຂະ​ໜາດ​ໃຫຍ່.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try ໂຄໂຣ Now

Generate your first audio free. No credit card required.

Start Free