​ក្រឡា​ចត្រង្គ

Premium

ເວົ້າ​ແບບ​ສະແດງ​ອອກ​ດ້ວຍ​ອາລົມ ແລະ ສຽງ

Slow ໄວ
Very Good ຄຸນນະພາບ
​ບໍ່​ໄດ້​ ​ក្លូន
13 ພາສາ

ກ່ຽວ​ກັບ ​ក្រឡា​ចត្រង្គ

-text-to-speech (TTS) and voice-to-text (VOT) effects. Bark is the first TTS model to use voice-to-text (VOT) to generate speech. It is the first TTS model to use voice-to-text (VOT) to generate speech. It is the first TTS model to use voice-to-text (VOT) to generate speech. It can

ຄຸນ​ສົມບັດ​ຫຼັກ

ສະແດງ​ອາລົມ

ສ້າງການເວົ້າດ້ວຍສຽງຫົວ, ຖອຍຫຼັງ, ຖອຍຫຼັງ ແລະ ຮູ້ສຶກທີ່ແທ້ຈິງ.

ຕົວ​ຊີ້​ວັດ​ອາລົມKCharselect unicode block name

ໃຊ້ [ສຽງ​ຍິ້ມ], [ສຽງ​ຍິ້ມ], CAPS ເພື່ອ​ເນັ້ນ​ໜັກ ແລະ... ເພື່ອ​ລໍຖ້າ.

ຫຼາຍພາສາ

ສະຫນັບສະຫນູນ 13+ ພາສາທີ່ມີການເວົ້າແລະການອອກສຽງທໍາມະຊາດ.

ດົນຕີ ແລະ ຜົນ​ງານ

ສາມາດສ້າງດົນຕີງ່າຍໆ ແລະ ສຽງ​ສິ່ງແວດລ້ອມໄດ້

ຕັ້ງຄ່າ​ລ່ວງໜ້າ​ຂອງ​ຫູຟັງ

ສຽງ​ຜູ້​ເວົ້າ​ທີ່​ໄດ້​ຝຶກ​ກ່ອນ​ຫຼາຍ​ໂຕ​ດ້ວຍ​ແບບ​ທີ່​ແຕກ​ຕ່າງ​ກັນ.

ແຫຼ່ງ​ເປີດ

MIT ອະນຸຍາດໃຫ້ໃຊ້ກັບສິດທິການໃຊ້ທຸລະກິດເຕັມ.

ກໍລະນີ​ໃຊ້

ພາ​ສາ​ທີ່​ໃຊ້​ໃນ​ປັດຈຸບັນ ເນື້ອໃນ​ທີ່​ມີ​ຊີວະພາບ ບັນທຶກ​ສຽງ ສຽງ​ເກມ​ ໂຄງການ​ສ້າງສັນ ຕົວຊ່ວຍ​ສະແດງ​ອອກ

​ក្រឡា​ចត្រង្គ Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

ວິທີການ​ໃຊ້ ​ក្រឡា​ចត្រង្គ

  1. 1

    ລົງທະບຽນຟຣີ ແລະເປີດການສະແດງ

    ສ້າງບັນຊີຟຣີ TextToSpeechAI ເພື່ອຮຽກຮ້ອງໃຫ້ມີສິນເຊື່ອເລີ່ມຕົ້ນຂອງທ່ານ, ຫຼືໃຊ້ການສະແດງແບບບໍ່ມີການລົງທະບຽນເພື່ອພະຍາຍາມ Bark ທັນທີ. ສິນເຊື່ອຟຣີແມ່ນພຽງພໍທີ່ຈະສ້າງຄລິບ Bark ສະແດງອອກຫຼາຍກ່ອນທີ່ທ່ານຈະອັບເດດ.

  2. 2

    ເລືອກ​ສຽງ​ທີ່​ຈະ​ໃຊ້

    ເປີດ​ຫໍສະໝຸດ​ສຽງ ແລະ ເລືອກ​ຕົວ​ຕັ້ງ​ສຽງ​ທີ່​ເໝາະສົມ​ກັບ​ສຽງ​ທີ່​ທ່ານ​ຕ້ອງການ. ສຽງ​ຂອງ​ການ​ເວົ້າ​ແມ່ນ​ຖືກ​ຈັດ​ເປັນ​ລະດັບ​ສູງ (25 ຄະແນນ​ຕໍ່​ຕົວ​ອັກສອນ 1000) ແລະ ຖືກ​ປັບ​ໃຫ້​ເປັນ​ການ​ເວົ້າ​ແບບ​ຕົວ​ອັກສອນ​ທີ່​ມີ​ອາລົມ​ໃຈ​.

  3. 3

    ເຂົ້າ​ເຖິງ​ຂໍ້ຄວາມ​ດ້ວຍ​ຕົວ​ຊີ້​ວັດ​ອາລົມ

    ພິມ​ສະຄິບ​ຂອງ​ທ່ານ ແລະ ວາງ​ຕົວ​ຊີ້​ວັດ​ອາລົມ​ຂອງ​ທ່ານ​ໄວ້​ໃນ​ແຖບ: [laughter] ສຳ​ລັບ​ການ​ຮ້ອງ, [sighs] ສຳ​ລັບ​ການ​ຍິ້ມ, [gasps] ສຳ​ລັບ​ການ​ຍິ້ມ,... ສຳ​ລັບ​ການ​ຢຸດ, ແລະ CAPS ສຳ​ລັບ​ການ​ເນັ້ນ​ໜັກ. ຕົວຢ່າງ: "ໂອ້ ໂອ້! [laughter] ສິ່ງນີ້​ແມ່ນ​ໜ້າ​ຕື່ນເຕັ້ນ... ຂ້ອຍ​ບໍ່​ເຊື່ອ​ມັນ!"

  4. 4

    ສ້າງ​ສຽງ

    ກົດ​ທີ່​ປຸ່ມ​ສ້າງ ແລະ Bark ຈະ​ສະແດງ​ຂໍ້ຄວາມ​ຂອງທ່ານ​ເປັນ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ໝາຍ, ປ່ຽນ​ຕົວ​ຊີ້​ວັດ​ແຕ່ລະ​ອັນ​ເປັນ​ສຽງ​ທີ່​ເໝາະສົມ. ການ​ສ້າງ​ແມ່ນ​ຊ້າ​ກວ່າ​ເຄື່ອງຈັກ​ທີ່​ເບົາ​ກວ່າ ຍ້ອນ​ແບບ​ຟອມ​ປ່ຽນ​ແປງ​ຂອງ Bark, ສະນັ້ນ​ໃຫ້​ໃຊ້​ວິນາທີ​ເພີ່ມ​ອີກ​ບາງ​ອັນ​ຕໍ່​ຄຳ​ສັບ.

  5. 5

    ດາວໂຫລດ ຫຼື ໃຊ້ API

    ເບິ່ງຜົນໄດ້ຮັບກ່ອນ, ຫຼັງຈາກນັ້ນດາວໂຫລດມັນເປັນ MP3, WAV, ຫຼື OGG. ເພື່ອເຮັດໃຫ້ Bark ອັດຕະໂນມັດໃນແອັບພລິເຄຊັນຂອງທ່ານ, ໂທຫາ TextToSpeechAI API ທີ່ມີສຽງ Bark ແລະຂໍ້ຄວາມທີ່ມີຕົວຊີ້ວັດທີ່ອຸດົມສົມບູນເພື່ອເອົາສຽງທີ່ສະແດງອອກມາຄືນ.

​ក្រឡា​ចត្រង្គ API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ໂອ້ ໂອ້! [ສຽງຫົວ] ນີ້ແມ່ນຫນ້າປະຫລາດໃຈ... ຂ້າພະເຈົ້າພຽງແຕ່ຮັກວິທີການສະແດງອອກນີ້ສຽງ!",
    "voice": "bark-zh_0"
  }'

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Bark ແມ່ນ​ແບບ​ແບບ​ທີ່​ອີງ​ໃສ່​ການ​ປ່ຽນ​ຂໍ້​ຄວາມ​ເປັນ​ສຽງ​ທີ່​ສ້າງ​ໂດຍ Suno. ບໍ່​ຄື​ກັບ​ລະບົບ TTS ແບບ​ເກົ່າ, Bark ສ້າງ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ໝາຍ​ສູງ​ດ້ວຍ​ອາລົມ​ແບບ​ທຳມະຊາດ, ສຽງ​ຫົວ, ສຽງ​ຍິ້ມ ແລະ ສຽງ​ອື່ນໆ​ທີ່​ບໍ່​ເວົ້າ​ໄດ້. ມັນ​ຍັງ​ສາມາດ​ສ້າງ​ດົນຕີ ແລະ ຜົນ​ສະທ້ອນ​ສຽງ​ໄດ້​ອີກ​ດ້ວຍ.

ຍິນດີ, Bark ແມ່ນ open-source ພາຍໃຕ້ໃບອະນຸຍາດ MIT, ອະນຸຍາດໃຫ້ໃຊ້ທຸລະກິດຟຣີ. ສໍາລັບ TextToSpeechAI, ພວກເຮົາຄິດຄ່າທໍານຽມ 25 ສິນເຊື່ອຕໍ່ 1000 ຕົວອັກສອນເນື່ອງຈາກຊັບພະຍາກອນ GPU ຢ່າງຫຼວງຫຼາຍທີ່ຕ້ອງການສໍາລັບການສ້າງ.

Bark ສະຫນັບສະຫນູນ 13+ ພາສາລວມທັງພາສາອັງກິດ, ເຢຍລະມັນ, ສະເປນ, ຝຣັ່ງ, ອິນເດຍ, ອີຕາລີ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ໂປແລນ, PORTUGUESE, ລັດເຊຍ, ຕຸລະກີ, ແລະຈີນ. ພາສາແຕ່ລະພາສາມີການອອກສຽງທໍາມະຊາດແລະ accents.

Bark ແມ່ນຊ້າກວ່າເຄື່ອງຈັກ TTS ສ່ວນໃຫຍ່ຍ້ອນສະຖາປັດຕະຍະກໍາປ່ຽນແປງ autoregressive ຂອງມັນ. ຄໍາສັບປົກກະຕິໃຊ້ເວລາ 5- 15 ວິນາທີເພື່ອສ້າງໃນ GPU. ການແລກປ່ຽນແມ່ນມີຄວາມໝາຍຫຼາຍຂຶ້ນແລະຜົນຜະລິດທໍາມະຊາດ.

Bark ພຽງແຕ່ສະເໜີການກັ່ນຕອງສຽງທີ່ຈຳກັດຜ່ານ "ຄໍາຖາມ semantic" ແລະ ຕົວເລືອກຜູ້ເວົ້າກ່ອນ, ສະນັ້ນມັນບໍ່ສາມາດກັ່ນຕອງສຽງທີ່ບໍ່ມີຕົວຕົນຈາກຕົວຢ່າງໄດ້ຢ່າງເຊື່ອຖືໄດ້. ຖ້າການກັ່ນຕອງສຽງເຕັມແມ່ນເປົ້າ ໝາຍ ຂອງທ່ານ, ໃຊ້ F5-TTS, StyleTTS2, OpenVoice, ຫຼື Tortoise ແທນ, ທຸກຢ່າງທີ່ສາມາດໃຊ້ໄດ້ໃນ TextToSpeechAI.

Bark ອ່ານ​ຕົວ​ຊີ້​ວັດ​ໃນ​ແຖບ​ທີ່​ໄດ້​ວາງ​ໄວ້​ໂດຍ​ກົງ​ໃນ​ຂໍ້ຄວາມ​ຂອງທ່ານ ແລະ ປ່ຽນ​ພວກ​ມັນ​ເປັນ​ສຽງ​ທີ່​ກົງ​ກັນ​ໄດ້. ໃຊ້ [laughter] ສຳ​ລັບ​ການ​ຍິ້ມ, [sighs] ສຳ​ລັບ​ການ​ຍິ້ມ, [gasps] ສຳ​ລັບ​ການ​ຍິ້ມ,... ສຳ​ລັບ​ການ​ລໍຖ້າ ຫຼື ຢຸດ, ແລະ CAPS ສຳ​ລັບ​ການ​ເນັ້ນ​ໜັກ. ຕົວຢ່າງ: "ໂອ້ ໂອ້! [laughter] ສິ່ງ​ນີ້​ແມ່ນ​ໜ້າ​ຕື່ນເຕັ້ນ... ຂ້ອຍ​ບໍ່​ເຊື່ອ​ມັນ!"

ນອກເໜືອຈາກຄໍາເວົ້າທີ່ງ່າຍດາຍ, Bark ສາມາດຜະລິດສຽງທີ່ບໍ່ເວົ້າເຊັ່ນ: ສຽງຫົວ, ສຽງຍິ້ມ, ສຽງດັງ, ສຽງປືນ, ແລະສຽງຖອກທ້ອງ, ນອກນັ້ນຍັງມີດົນຕີງ່າຍໆແລະຜົນກະທົບດ້ານສິ່ງແວດລ້ອມ. ສິ່ງເຫຼົ່ານີ້ຖືກກະຕຸ້ນດ້ວຍຕົວຊີ້ວັດເຊັ່ນ: [laughter], [sighs], ແລະ [gasps] ທີ່ຝັງຢູ່ໃນຂໍ້ຄວາມ, ເຊິ່ງເຮັດໃຫ້ Bark ຮູ້ສຶກວ່າມີຄວາມຮູ້ສຶກຫຼາຍກ່ວາ TTS ມາດຕະຖານ.

Bark ຜະລິດສຽງທີ່ມີຄຸນນະພາບດີຫຼາຍດ້ວຍຄວາມປາຖະຫນາທີ່ແທ້ຈິງທີ່ແຂ່ງກັບຄໍາເວົ້າຂອງມະນຸດ ສຳ ລັບເນື້ອຫາທີ່ຮູ້ສຶກ. ຜົນໄດ້ຮັບ 24kHz ສຽງມືອາຊີບ, ເຖິງແມ່ນວ່າຄຸນນະພາບຂອງຄໍາເວົ້າທີ່ບໍລິສຸດແມ່ນຢູ່ພາຍໃຕ້ StyleTTS2 ພຽງເລັກນ້ອຍ.

Bark ຕ້ອງການ 8-12GB ຂອງ VRAM ອີງຕາມຂະ ໜາດ ຂອງແບບ. ແບບເຕັມຕ້ອງການ ~ 12GB, ໃນຂະນະທີ່ຕົວເລືອກທີ່ນ້ອຍກວ່າເຮັດວຽກກັບ 8GB. CPU ຄິດໄລ່ແມ່ນຊ້າຫຼາຍແລະບໍ່ແນະ ນຳ.

ຍິນດີຕ້ອນຮັບ, Bark ແມ່ນ MIT ໃບອະນຸຍາດ, ເຊິ່ງອະນຸຍາດໃຫ້ການນໍາໃຊ້ການຄ້າບໍ່ຈໍາກັດໂດຍບໍ່ມີຄ່າອະນຸຍາດ. ທ່ານສາມາດໃຊ້ Bark ໃນຜະລິດຕະພັນ, ການບໍລິການ, ແລະຄໍາຮ້ອງສະຫມັກຟຣີ. ກ່ຽວກັບການ TextToSpeechAI ທ່ານສາມາດພະຍາຍາມ Bark ຟຣີໂດຍການໃຊ້ເງິນກູ້ຢືມລົງທະບຽນຂອງທ່ານກ່ອນທີ່ຈະຈ່າຍສໍາລັບຫຼາຍ.

Bark ດີທີ່ສຸດໃນ ການເວົ້າແບບ 1- speaker ທີ່ມີ ຕົວຊີ້ບອກອາລົມ ເຊັ່ນ [ ຫົວຍິ້ມ] ແລະ [ ຍິ້ມ], ໃນຂະນະທີ່ Dia ຖືກສ້າງຂຶ້ນ ສຳ ລັບ ການສົນທະນາຫຼາຍຄົນທີ່ມີ [S1] / [S2] ປ່ຽນແລະບໍ່ເວົ້າ. ເລືອກ Bark ສຳ ລັບ ການເວົ້າທີ່ເຕັມໄປດ້ວຍອາລົມ ແລະ ສຽງຕົວລະຄອນ, ແລະ Dia ສຳ ລັບ ການສົນທະນາ back-and-forth. ທັງສອງມີຢູ່ໃນ TextToSpeechAI.

Bark ມີ​ຄວາມ​ສາມາດ​ທີ່​ເປັນເອກະລັກ​ໃນການ​ສ້າງ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ຮູ້ສຶກ ແລະ ສຽງ​ທີ່ບໍ່​ເວົ້າ​ໄດ້​ຢ່າງ​ແທ້​ຈິງ. ມັນ​ຊ້າ​ກວ່າ​ເຄື່ອງຈັກ​ອື່ນໆ ແຕ່​ຜະລິດ​ຜົນ​ທີ່​ຄື​ກັບ​ມະນຸດ​ຫຼາຍ​ຂຶ້ນ​ສຳລັບ​ເນື້ອໃນ​ທີ່​ສ້າງສັນ. ສຳ​ລັບ​ການ​ປະສົມ​ໄວ​ຂຶ້ນ, ໃຊ້ Piper. ສຳ​ລັບ​ການ​ກັ່ນຕອງ​ສຽງ, ໃຊ້ F5- TTS ຫຼື OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try ​ក្រឡា​ចត្រង្គ Now

Generate your first audio free. No credit card required.

Start Free