ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name

Premium

ການ​ກັ່ນຕອງ​ສຽງ​ຫຼາຍ​ພາສາ​ແບບ Zero-shot ໂດຍ​ມີ​ການ​ສະໜັບສະໜູນ​ການ​ຖ່າຍ​ທອດ

Fast ໄວ
Very Good ຄຸນນະພາບ
​ແມ່ນ ​ក្លូន
5 ພາສາ

ກ່ຽວ​ກັບ ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name

[Translation temporarily unavailable. Please try again.]

ຄຸນ​ສົມບັດ​ຫຼັກ

ການ​ກັ່ນຕອງ​ສຽງ Zero-Shot

ສ້າງ​ສຽງ​ໃດ​ກໍ​ໄດ້​ຈາກ 3-10 ວິນາທີ​ຂອງ​ສຽງ​ທີ່​ອີງ​ໃສ່​ດ້ວຍ​ຄວາມ​ເຊື່ອ​ຖື​ສູງ

ຫຼາຍພາສາ

ສະໜັບສະໜູນພາສາຈີນ, ພາສາອັງກິດ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ແລະ Cantonese ດ້ວຍການສັງເຄາະພາສາຕ່າງກັນ.

ການສະ​ໜັບສະໜູນ​ການ​ຖ່າຍ​ທອດ

ໂມດູນ​ດາວໂຫລດ​ແບບ​ດັ້ງເດີມ​ທີ່​ມີ​ຄວາມ​ຊ້າ​ຕ່ຳ​ສຳລັບ​ໂປແກຼມ​ທີ່​ໃຊ້​ເວລາ​ຈິງ ແລະ ລະບົບ​ທີ່​ມີ​ການ​ໂຕ້ຕອບ​ກັນ

ສຽງ​ທຳມະຊາດ

ການ​ສ້າງ​ແບບ​ແບບ​ສຽງ​ທີ່​ກ້າວ​ໜ້າ​ຈະ​ຜະລິດ​ສຽງ​ເວົ້າ​ທີ່​ມີ​ສຽງ​ທໍາມະຊາດ​ພ້ອມ​ດ້ວຍ​ການ​ເວົ້າ​ທີ່​ເໝາະສົມ.

ກໍລະນີ​ໃຊ້

ສ້າງເນື້ອໃນ​ຫຼາຍພາສາ ຕົວຊ່ວຍສຽງ real-time ພາສາ​ຕ່າງ​ກັນ កម្មវិធី​ສຽງ​ທີ່​ໄດ້​ປັບ​ແຕ່ງ​ເອງ

ວິທີການ​ໃຊ້ ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name

  1. 1

    ລົງທະບຽນ ແລະ ຂໍເງິນກູ້ຟຣີ

    ສ້າງບັນຊີ TextToSpeechAI ຟຣີ ເພື່ອຂໍເງິນກູ້ເລີ່ມຕົ້ນຂອງທ່ານ, ຫຼື ທົດລອງໃຊ້ demo ກ່ອນ. ບໍ່ຈໍາເປັນຕ້ອງຕິດຕັ້ງ GPU ຫຼື CosyVoice2 ທ້ອງຖິ່ນ - ທຸກຢ່າງແລ່ນຢູ່ໃນພື້ນຖານໂຄງລ່າງຂອງພວກເຮົາ.

  2. 2

    ເລືອກ CosyVoice2 ແລະ ເພີ່ມ​ຄລິບ​ອ້າງອີງ

    ເລືອກ CosyVoice2 ເປັນ​ເຄື່ອງຈັກ​ຂອງ​ທ່ານ, ຫຼັງຈາກ​ນັ້ນ​ອັບ​ໂຫລດ​ການ​ບັນທຶກ​ທີ່​ອີງ​ໃສ່​ສຽງ​ທີ່​ທ່ານ​ຕ້ອງການ​ klon ໄວ້​ໃນ​ໄລຍະ​ເວລາ 3- 10 ວິນາທີ. CosyVoice2 ຈະ​ຖອດ​ຄຸນ​ລັກ​ສະ​ນະ​ຂອງ​ຜູ້​ເວົ້າ​ອອກ​ມາ​ເພື່ອ​ການ​ກລອນ​ພາສາ​ຫຼາຍ​ພາສາ​ແບບ zero- shot.

  3. 3

    ເຂົ້າ​ເຖິງ​ຂໍ້ຄວາມ​ຂອງທ່ານ​ໃນ​ພາສາ​ທີ່​ໄດ້​ຮັບ​ການ​ສະໜັບສະໜູນ

    ພິມ ຫຼື ປ້າຍ​ສະຄິບ​ຂອງທ່ານ​ເປັນ​ພາສາ​ຈີນ, ພາສາ​ອັງກິດ, ພາສາ​ຍີ່ປຸ່ນ, ພາສາ​ເກົາຫຼີ ຫຼື ພາສາ​ຄານໂຕນ. CosyVoice2 ສະໜັບສະໜູນ​ການ​ປະສົມ​ພາສາ​ກັນ, ສະນັ້ນ​ສຽງ​ທີ່​ໄດ້​ກລອງ​ສາມາດ​ເວົ້າ​ພາສາ​ທີ່​ແຕກຕ່າງ​ຈາກ​ຄລິບ​ທີ່​ອ້າງອີງ​ໄດ້.

  4. 4

    ສ້າງ​ການ​ເວົ້າ

    ກົດ​ເພື່ອ​ສ້າງ ແລະ CosyVoice2 ຈະ​ປະສົມ​ປະສານ​ການ​ເວົ້າ​ແບບ​ທໍາ​ມະ​ຊາດ​ຫຼາຍ​ພາສາ​ໃນ​ສຽງ​ທີ່​ໄດ້​ກລອງ​ໄວ້, ໂດຍ​ປົກກະຕິ​ແລ້ວ​ຈະ​ເປັນ​ໄລຍະ​ເວລາ​ສອງ​ວິນາທີ​ສຳລັບ​ຂໍ້​ຄວາມ​ສັ້ນໆ. ການ​ໃຊ້​ງານ​ຂັ້ນ​ສູງ​ຈະ​ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ 25 ເຄຣດິດ​ຕໍ່​ຕົວ​ອັກສອນ 1, 000.

  5. 5

    ດາວໂຫລດ ຫຼື ໃຊ້ API

    ດາວໂຫລດສຽງທີ່ສໍາເລັດເປັນ MP3 ຫຼື WAV ຈາກປະຫວັດຂອງທ່ານ, ຫຼືອັດຕະໂນມັດ CosyVoice2 ສຽງ cloning ໃນຂະໜາດຜ່ານ TextToSpeechAI REST API.

ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 ສົ່ງການເວົ້າຫຼາຍພາສາແບບທໍາມະຊາດ ທີ່ມີຄວາມສາມາດໃນການກັ່ນຕອງສຽງແບບ zero\u002Dshot.",
    "voice": "en_US-lessac-medium"
  }'

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

CosyVoice2 is a next-generation text-to-speech and voice cloning model from FunAudioLLM (Alibaba). It supports zero-shot voice cloning from just a few seconds of reference audio and can synthesize natural speech in Chinese, English, Japanese, Korean, and Cantonese. On TextToSpeechAI you can run CosyVoice2 in the browser without any local setup.

ຍິນດີ, CosyVoice2 ແມ່ນ Apache 2.0 ໃບອະນຸຍາດເຕັມ - ທັງສອງໂປຣແກຣມແລະແບບຈໍາລອງນໍ້າໜັກ. ນີ້ເຮັດໃຫ້ມັນປອດໄພທີ່ຈະໃຊ້ໃນຜະລິດຕະພັນການຄ້າ, ເນື້ອໃນຈ່າຍ, ແລະລູກຄ້າເຮັດວຽກໂດຍບໍ່ມີຄ່າອະນຸຍາດຫຼືບໍ່ຈໍາກັດການຄ້າ.

CosyVoice2 ສະໜັບສະໜູນ5ພາສາ: ຈີນ (Mandarin), ພາສາອັງກິດ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ແລະ ພາສາກວາງໂຈ່. ມັນຍັງສາມາດຈັດການການປະສົມພາສາ, ສະນັ້ນທ່ານສາມາດກລອນສຽງຈາກການບັນທຶກໃນພາສາຫນຶ່ງແລະສ້າງການເວົ້າໃນພາສາອື່ນ.

ສະຫນອງ 3-10 ວິນາທີຂອງສຽງທີ່​ໄດ້​ຮັບ​ການ​ອ້າງອີງ​ທີ່​ສະອາດ​ຂອງ​ຜູ້​ເວົ້າ​ເປົ້າ​ໝາຍ. CosyVoice2ດຶງ​ເອົາ​ຄຸນ​ລັກ​ສະ​ນະ​ຂອງ​ຜູ້​ເວົ້າ​ໂດຍ​ໃຊ້​ການ​ເຂົ້າ​ເຖິງ​ການ​ວັດ​ແທກ​ທີ່​ມີ​ຈຸດ​ຈົບ, ຫຼັງຈາກ​ນັ້ນ​ສ້າງ​ການ​ເວົ້າ​ໃໝ່​ໃນ​ສຽງ​ທີ່​ໄດ້​ກລອນ​ຜ່ານ​ພາສາ​ທີ່​ໄດ້​ຮັບ​ການ​ສະໜັບສະໜູນ​ໃດໆ. ບໍ່ມີ​ການ​ຝຶກ​ແບບ​ຫຼື​ການ​ປັບ​ຄວາມ​ຖືກຕ້ອງ​ທີ່​ຕ້ອງການ.

CosyVoice2 ແມ່ນ​ໜຶ່ງ​ໃນ​ແບບ​ຟອມ​ການ​ກັ່ນຕອງ​ພາສາ​ຫຼາຍ​ພາສາ​ທີ່​ແຂງ​ແຮງ​ກວ່າ​ເກົ່າ, ຮັກສາ​ຕົວ​ຕົນ​ຂອງຜູ້​ເວົ້າ​ໄວ້​ເຖິງ​ແມ່ນ​ເມື່ອ​ສ້າງ​ການ​ເວົ້າ​ໃນ​ພາສາ​ທີ່​ແຕກຕ່າງ​ຈາກ​ຄລິບ​ທີ່​ອ້າງ​ອີງ. ມັນ​ຜະລິດ​ສຽງ​ທີ່​ມີ​ຄວາມ​ຊັດເຈນ​ແລະ​ສຽງ​ທີ່​ມີ​ຄວາມ​ຊັດເຈນ​ຕາມ​ທຳມະຊາດ, ເຊິ່ງ​ເຮັດ​ໃຫ້​ມັນ​ເໝາະສົມ​ກັບ​ການ​ດັດ​ແປງ​ພາສາ​ແລະ​ເນື້ອ​ໃນ​ທີ່​ໄດ້​ຮັບ​ການ​ປັບ​ປຸງ​ພື້ນ​ທີ່​ໄດ້​ດີ.

ຍອມຮັບ. CosyVoice2 ແມ່ນ​ແບບ​ຢ່າງ​ທີ່​ໄວ ແລະ​ລວມ​ມີ​ຮູບແບບ​ການ​ຖ່າຍ​ທອດ​ທີ່​ຜະລິດ​ສຽງ​ດ້ວຍ​ຄວາມ​ຊ້າ​ຕ່ຳ, ເຮັດໃຫ້​ມັນ​ເໝາະສົມ​ກັບ​ຜູ້​ຊ່ວຍ​ສຽງ ແລະ​ການ​ປະສານ​ງານ​ກັບ​ໂປແກຼມ. ເທິງ TextToSpeechAI ໄວ​ລຸ້ນ​ປົກກະຕິ​ແລ້ວ​ຈະ​ສຳເລັດ​ໃນ​ວິນາທີ​ສຳລັບ​ຂໍ້ຄວາມ​ສັ້ນໆ.

CosyVoice2 ຕ້ອງການປະມານ 4-6GB ຂອງ VRAM ສຳ ລັບແບບ ຈຳ ລອງຕົວຊີ້ວັດ 0.5B, ສະນັ້ນ GPU ທີ່ມີ 6GB ຫຼືຫຼາຍກວ່ານັ້ນແມ່ນແນະ ນຳ ໃນເວລາທີ່ໂປແກຼມໂປແກຼມເອງ. ຢູ່ໃນ TextToSpeechAI ແບບ ຈຳ ລອງແລ່ນໃນພື້ນຖານໂຄງລ່າງ GPU ຂອງພວກເຮົາ, ສະນັ້ນທ່ານບໍ່ຕ້ອງການຮາດແວໃດໆຂອງຕົວທ່ານເອງ.

CosyVoice2 ແມ່ນແບບຟອມຊັ້ນສູງແລະຄ່າໃຊ້ຈ່າຍ 25 ເຄດິດຕໍ່ 1,000 ຕົວອັກສອນຂອງຂໍ້ຄວາມ. ບັນຊີໃຫມ່ທຸກໆຄົນໄດ້ຮັບຟຣີ starter ເຄດິດ, ດັ່ງນັ້ນທ່ານສາມາດພະຍາຍາມ CosyVoice2 ສຽງ cloning ກ່ອນທີ່ຈະຕັດສິນໃຈກ່ຽວກັບແຜນທີ່ຈ່າຍ.

ສອງ​ຢ່າງ​ແມ່ນ​ເຄື່ອງຈັກ​ການ​ກັ່ນຕອງ​ສຽງ​ທີ່​ດີ​ທີ່ສຸດ. GPT- SoVITS ມັກ​ຈະ​ບັນລຸ​ຄວາມ​ຄືບ​ໜ້າ​ທີ່​ສູງ​ສຸດ​ສຳລັບ​ສຽງ​ເປົ້າ​ໝາຍ​ດຽວ, ໃນຂະນະທີ່ CosyVoice2 ມີຄວາມ​ແຂງ​ແຮງ​ກວ່າ​ສຳລັບ​ການ​ກັ່ນຕອງ​ພາສາ​ຫຼາຍ​ພາສາ ແລະ ພາສາ​ຕ່າງກັນ ແລະ ເພີ່ມ​ການ​ຖ່າຍ​ທອດ​ແບບ​ລົບ​ລ້າງ​ຄວາມ​ລໍຖ້າ​ຕ່ຳ. ເລືອກ CosyVoice2 ເມື່ອ​ທ່ານ​ຕ້ອງການ​ສຽງ​ກັ່ນຕອງ​ດຽວ​ເພື່ອ​ເວົ້າ​ພາສາ​ຫຼາຍ​ພາສາ.

ສອງ​ຢ່າງ​ນີ້​ໄດ້​ສະ​ເໜີ​ການ​ກັ່ນຕອງ​ສຽງ​ແບບ​ບໍ່​ມີ​ການ​ກັ່ນຕອງ​ສຽງ​ທີ່​ມີ​ຄຸນ​ນະ​ພາບ​ສູງ​. CosyVoice2 ສະໜັບສະໜູນ​ພາສາ​ຫຼາຍ​ຂຶ້ນ (5 versus2) ແລະ​ເພີ່ມ​ການ​ຖ່າຍ​ທອດ​ສຽງ​ເພື່ອ​ໃຊ້​ເວລາ​ຈິງ, ໃນຂະນະທີ່ F5- TTS ສາມາດ​ໄວ​ກວ່າ​ເລັກ​ນ້ອຍ​ສຳລັບ​ການ​ໃຊ້​ງານ​ພາສາ​ອັງກິດ​ເທົ່ານັ້ນ. ສຳລັບ​ໂຄງການ​ຫຼາຍ​ພາສາ, CosyVoice2 ແມ່ນ​ປົກກະຕິ​ແລ້ວ​ຈະ​ເໝາະສົມ​ກວ່າ​ເກົ່າ.

TextToSpeechAI ອະນຸຍາດໃຫ້ທ່ານສົ່ງອອກ CosyVoice2 ພັນໃນຮູບແບບທົ່ວໄປເຊັ່ນ MP3 ແລະ WAV. ທ່ານສາມາດດາວໂຫລດໄຟລ໌ໂດຍກົງຈາກ ໜ້າ ປະຫວັດຂອງທ່ານຫຼືດາວໂຫລດມັນໂດຍຜ່ານ API TextToSpeechAI.

Yes. You can test CosyVoice2 with the free demo and your free starter credits on TextToSpeechAI without installing anything. Just sign up, upload a short reference clip, type your text in any supported language, and generate.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try ສຽງ​ທີ່​ສະດວກ​ສະບາຍ2Name Now

Generate your first audio free. No credit card required.

Start Free