​ Chatterbox

Premium

ການ​ກັ່ນຕອງ​ສຽງ​ແບບ Zero-shot ດ້ວຍ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ໝາຍ​ໃນ 23 ພາສາ

Fast ໄວ
Very Good ຄຸນນະພາບ
​ແມ່ນ ​ក្លូន
23 ພາສາ

ກ່ຽວ​ກັບ ​ Chatterbox

[Translation temporarily unavailable. Please try again.]

ຄຸນ​ສົມບັດ​ຫຼັກ

ການ​ກັ່ນຕອງ​ສຽງ Zero-Shot

ສ້າງ​ສຽງ​ໃດ​ໜຶ່ງ​ຈາກ​ສຽງ​ບໍ່​ເທົ່າ​ໃດ​ວິນາທີ - ບໍ່​ຕ້ອງ​ການ​ຝຶກ​ອົບຮົມ​ຫຍັງ​ເລີຍ

ພາສາ

ຈາກພາສາອາຣັບ ໄປຫາພາສາຈີນ, ລວມເຖິງພາສາໃຫຍ່ໆຂອງໂລກ

ແທັກ​ສະແດງ​ອອກ

ເພີ່ມ [laugh], [cough], [chuckle] ສຳລັບສຽງທີ່ໃຊ້ພາສາທໍາມະຊາດ.

​ການ​ຄິດໄລ່​ໄວ

ລະຫັດຜ່ານ Sub-200ms ທີ່ມີ Turbo ສໍາລັບຄໍາຮ້ອງສະຫມັກເວລາຈິງ.

ກໍລະນີ​ໃຊ້

ການ​ກັ່ນຕອງ​ສຽງ​ເພື່ອ​ສ້າງ​ເນື້ອໃນ កម្មវិធី​ສຽງ​ຫຼາຍ​ພາສາName ສຽງ​ຂອງ​ຕົວ​ອັກສອນ​ທີ່​ໄດ້​ອອກແບບ​ມາ​ສຳລັບ​ເກມ ຕົວຊ່ວຍສຽງ​ທີ່​ໄດ້​ປັບ​ແຕ່ງ​ເອງ

ວິທີການ​ໃຊ້ ​ Chatterbox

  1. 1

    ລົງທະບຽນ ຫຼື ເປີດ​ການ​ທົດລອງ

    ສ້າງບັນຊີ TextToSpeechAI ໂດຍບໍ່ເສຍຄ່າ ເພື່ອຂໍເງິນ 200 ໂດລາ ຫຼື ໃຊ້ Demo ເທິງໜ້າເວັບ ເພື່ອທົດລອງໃຊ້ Chatterbox ໂດຍບໍ່ຕ້ອງເຂົ້າສູ່ລະບົບ.

  2. 2

    ເລືອກ Chatterbox ແລະ ເພີ່ມ​ຄລິບ​ອ້າງອີງ

    ເລືອກ​ເຄື່ອງຈັກ Chatterbox, ຫຼັງຈາກນັ້ນ​ອັບໂຫລດ​ຄລິບສຽງ​ສັ້ນໆ (ບໍ່​ເທົ່າ​ໃດ​ວິນາທີ) ຂອງ​ສຽງ​ທີ່​ທ່ານ​ຕ້ອງການ​ກລອງ. Chatterbox zero-shot ກລອນ​ມັນ​ທັນທີ - ບໍ່​ຕ້ອງການ​ການ​ຝຶກ​ອົບຮົມ.

  3. 3

    ເຂົ້າ​ເຖິງ​ຂໍ້ຄວາມ​ຂອງ​ທ່ານ​ດ້ວຍ​ແທັກ​ທີ່​ເລືອກ

    ພິມ ຫຼື ປ້າຍ ຂໍ້ຄວາມ ເພື່ອເວົ້າໃນພາສາໃດໜຶ່ງ ທີ່ມີການສະໜັບສະໜູນ 23 ພາສາ ແລະ ວາງແທັກ [laugh], [cough], ຫຼື [chuckle] ຢູ່ບ່ອນໃດກໍໄດ້ທີ່ທ່ານຕ້ອງການສຽງທີ່ໃຊ້ພາສາທໍາມະຊາດ.

  4. 4

    ສ້າງ​ການ​ເວົ້າ

    ກົດສ້າງແລະ TextToSpeechAI ສະແດງຂໍ້ຄວາມຂອງທ່ານໃນສຽງ Chatterbox ແບບຄລານໃນພື້ນຖານໂຄງລ່າງ GPU ທີ່ຈັດການ, ໃຊ້ເວລາ 25 ຄະແນນຕໍ່ 1,000 ຕົວອັກສອນ.

  5. 5

    ດາວໂຫລດ ຫຼື ໃຊ້ API

    ດາວໂຫລດໄຟລ໌ສຽງທີ່ສໍາເລັດແລ້ວ, ຫຼືອັດຕະໂນມັດການຜະລິດຜ່ານ TextToSpeechAI REST API ທີ່ api.texttospeechai.com ການນໍາໃຊ້ບັນຊີຂອງທ່ານ token.

​ Chatterbox API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Chatterbox ສາມາດ clone ສຽງຂອງທ່ານຈາກພຽງແຕ່ສອງສາມວິນາທີຂອງສຽງແລະເວົ້າໃນ 23 ພາສາ.",
    "voice": "en_US-lessac-medium"
  }'

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Chatterbox ແມ່ນ ແບບຟອມ ຂໍ້ຄວາມ-ເປັນ-ຄໍາເວົ້າ ແບບຟອມ ສຽງ ແບບ 0-shot ຈາກ Resemble AI. ມັນສາມາດ ຖ່າຍທອດສຽງໃດກໍໄດ້ ຈາກ ສຽງ ຄໍາແນະນໍາ ພຽງ ສອງສາມ ວິນາທີ ແລະ ສ້າງ ຄໍາເວົ້າ ທີ່ ທໍາມະຊາດ, ສະແດງອອກ ໃນ 23 ພາສາ, ທັງຫມົດໂດຍບໍ່ມີການຝຶກອົບຮົມສຽງໃດໆ.

ຍິນດີ, Chatterbox ແມ່ນ MIT ອະນຸຍາດເຕັມ - ທັງສອງໂປຣແກຣມແລະແບບຈໍາລອງນໍ້າໜັກ - ດັ່ງນັ້ນທ່ານສາມາດໃຊ້ມັນໄດ້ຟຣີໃນຜະລິດຕະພັນການຄ້າ. ສຽງທີ່ຜະລິດປະກອບມີ watermark ນິວຣາລທີ່ເລືອກໄດ້ທີ່ສາມາດປິດໄດ້, ແລະບໍ່ມີຄ່າໃຊ້ຈ່າຍໃນການໃຊ້.

ທ່ານ​ໄດ້​ສະໜອງ​ການ​ອ້າງອີງ​ສັ້ນໆ​ຂອງ​ສຽງ​ໃດ​ໜຶ່ງ (ພຽງ​ແຕ່​ສອງສາມ​ວິນາທີ​ເທົ່າ​ນັ້ນ) ແລະ Chatterbox ຖອດ​ສຽງ​ນັ້ນ​ອອກ​ມາ ແລະ ແບບ​ຂອງ​ສຽງ​ນັ້ນ​ເຂົ້າ​ໄປ​ໃນ​ການ​ຝັງ​ສຽງ​ໃນ​ເຄື່ອງ​ເວົ້າ. ຫຼັງຈາກນັ້ນ ມັນ​ກໍ່​ສ້າງ​ການ​ເວົ້າ​ໃໝ່​ໃນ​ສຽງ​ນັ້ນ​ໂດຍ​ບໍ່​ມີ​ການ​ປັບ​ແຕ່ງ​ດີໆ ຫຼື ຂັ້ນຕອນ​ການ​ຝຶກ​ອົບຮົມ, ເຊິ່ງ​ແມ່ນ​ສິ່ງທີ່ "zero-shot" ຫມາຍຄວາມວ່າ.

Chatterbox ອ່ານ​ແທັກ​ໃນ​ແຖບ​ພິເສດ​ໃນ​ຂໍ້ຄວາມ​ຂອງທ່ານ ເພື່ອ​ເພີ່ມ​ສຽງ​ທີ່​ບໍ່​ເວົ້າ​ໄດ້​ຕາມ​ທໍາມະຊາດ: [laugh] ໃສ່​ສຽງ​ຮ້ອງ, [cough] ໃສ່​ສຽງ​ຫາຍໃຈ ແລະ [chuckle] ໃສ່​ສຽງ​ຊັກ​ຊ້າ. ພຽງແຕ່​ວາງ​ແທັກ​ຢູ່​ບ່ອນ​ທີ່​ທ່ານ​ຕ້ອງການ​ສຽງ, ຕົວຢ່າງ "ນັ້ນ​ແມ່ນ​ສຽງ​ທີ່​ມ່ວນ [laugh] ແຕ່​ຈິງ​ໃຈ...".

ພິມ​ແທັກ​ໂດຍ​ກົງ​ໃນ​ຂໍ້ຄວາມ​ເຂົ້າ​ມາ​ຂອງ​ທ່ານ​ທີ່​ຈຸດ​ທີ່​ສຽງ​ຄວນ​ຈະ​ເກີດ​ຂຶ້ນ, ຖືກ​ລ້ອມ​ຮອບ​ດ້ວຍ​ຄຳ​ສັບ​ທີ່​ເຫຼືອ​ຂອງ​ທ່ານ. Chatterbox ຈະ​ສະແດງ​ສຽງ​ທີ່​ເປັນ​ພາສາ​ຕ່າງ​ກັນ​ໃນ​ສຽງ​ທີ່​ໄດ້​ກລອງ, ລວມ​ມັນ​ເຂົ້າ​ກັບ​ການ​ເວົ້າ​ທີ່​ອ້ອມ​ຂ້າງ​ເພື່ອ​ໃຫ້​ມັນ​ມີ​ສຽງ​ແບບ​ສະໝໍ່າສະເຫມີ ແທນ​ທີ່​ຈະ​ເປັນ​ການ​ສັ່ນ​ສະເທືອນ​ໃນ​ມັນ.

Chatterbox ສະຫນັບສະຫນູນ 23 ພາສາ, ລວມທັງອາຣັບ, ເດນມາກ, ເຢຍລະມັນ, ກຣີກ, ພາສາອັງກິດ, ສະເປນ, ຟິນແລນ, ຝຣັ່ງ, ເຮບຣູ, ຮິນດີ, ອີຕາລີ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ມາເລເຊຍ, ດັ້ງເດີມ, ນໍເວ, ປອກຕຸຍການ, ປາຣູແກນ, ຣັດເຊຍ, ສະວິດ, Swahili, ຕຸລະກີ, ແລະ ຈີນ. ສຽງ cloned ດຽວສາມາດເວົ້າຜ່ານພາສາເຫຼົ່ານີ້.

Chatterbox ສ້າງການເວົ້າຢ່າງໄວວາໃນ GPU, ແລະ ຕົວເລືອກ Turbo ບັນລຸການລໍຖ້າພາຍໃຕ້ 200ms ສຳ ລັບການສົນທະນາໃນເວລາຈິງ. ຄຸນນະພາບແມ່ນດີຫຼາຍ, ດ້ວຍ prosody ທຳ ມະຊາດແລະສຽງທີ່ເຊື່ອຖືໄດ້ຈາກການຖ່າຍທອດສຽງຈາກຄລິບທີ່ອ້າງອີງສັ້ນ.

Chatterbox ຕ້ອງການປະມານ 4-8GB ຂອງ VRAM ອີງຕາມຕົວເລືອກ, ດ້ວຍແບບ Turbo ແລ່ນສະດວກສະບາຍໃນປະມານ 4GB. ຢູ່ໃນ TextToSpeechAI ທ່ານບໍ່ຕ້ອງການ GPU ທ້ອງຖິ່ນໃດໆ - ການຜະລິດແລ່ນຢູ່ໃນພື້ນຖານໂຄງລ່າງທີ່ໂຮມໄວ້ຂອງພວກເຮົາ.

Chatterbox ແມ່ນເຄື່ອງຈັກຊັ້ນສູງທີ່ມີລາຄາ 25 ຄະແນນຕໍ່ 1,000 ຕົວອັກສອນ. ບັນຊີໃຫມ່ໄດ້ຮັບ 200 ຄະແນນຟຣີເພື່ອພະຍາຍາມການກັ່ນຕອງສຽງ, ແລະທ່ານພຽງແຕ່ໃຊ້ຈ່າຍຄະແນນໃນຂໍ້ຄວາມທີ່ທ່ານໄດ້ສ້າງຂຶ້ນຢ່າງແທ້ຈິງ.

ສອງ ສະຫນັບສະຫນູນ zero-shot ສຽງ cloning, ແຕ່ Chatterbox ປົກຄຸມຫຼາຍພາສາ (23 vs 2) ແລະເພີ່ມຄໍາຫມາຍ paralinguistic ສະແດງອອກ. F5-TTS ສາມາດຂອບອອກອັງກິດ prosody ທໍາມະຊາດຫຼາຍຂຶ້ນເລັກນ້ອຍ, ດັ່ງນັ້ນເລືອກ Chatterbox ສໍາລັບ multilingual cloning ແລະສຽງສະແດງອອກ, ແລະ F5-TTS ສໍາລັບພາສາອັງກິດ-ພຽງແຕ່ fidelity.

Chatterbox ສະຫນັບສະຫນູນ 23 ພາສາແລະ inline ຄໍາອະທິບາຍ tags, ໃນຂະນະທີ່ OpenVoice ເພີ່ມການຄວບຄຸມ tone-style (ມິດ, ເສຍໃຈ, ໃຈຮ້າຍ, ແລະຫຼາຍກ່ວາ) ທີ່ Chatterbox ຂາດ. ເລືອກ Chatterbox ສໍາລັບພາສາທີ່ກວ້າງຂວາງແລະ OpenVoice ເມື່ອທ່ານຕ້ອງການທີ່ຈະເຮັດໃຫ້ emotional ສຽງ styling.

ຍິນດີຕ້ອນຮັບ. ລົງທະບຽນສໍາລັບການຟຣີ TextToSpeechAI ບັນຊີເພື່ອໄດ້ຮັບ 200 ເລີ່ມຕົ້ນ credits, ຫຼືນໍາໃຊ້ demo ຫນ້າເພື່ອຟັງ Chatterbox ໂດຍບໍ່ມີການເຂົ້າສູ່ລະບົບ. ສົ່ງຄລິບຄໍາແນະນໍາສັ້ນ, ພິມຂໍ້ຄວາມຂອງທ່ານ, ແລະສ້າງສຽງ cloned ໃນສອງວິນາທີ.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try ​ Chatterbox Now

Generate your first audio free. No credit card required.

Start Free