ແບບ TTS 2

Ultra

ຂໍ້ຄວາມ​ໄປ​ສູ່​ການ​ເວົ້າ​ໃນ​ລະດັບ​ມະນຸດ​ດ້ວຍ​ການ​ໂອນ​ແບບName

Moderate ໄວ
Excellent ຄຸນນະພາບ
​ແມ່ນ ​ក្លូន
1 ພາສາ

ກ່ຽວ​ກັບ ແບບ TTS 2

s. StyleTTS 2 is the first TTS system to incorporate the

ຄຸນ​ສົມບັດ​ຫຼັກ

ຄຸນ​ນະ​ພາບ​ລະດັບ​ມະນຸດ

ຜະລິດ​ສຽງ​ທີ່​ບໍ່​ສາມາດ​ແຍກ​ອອກ​ຈາກ​ການ​ບັນທຶກ​ຂອງ​ຄົນ​ໃນ​ການ​ທົດລອງ​ທີ່​ບັງ​ເອີນ.

ສົ່ງ​ແບບ

ໂອນ​ແບບ​ເວົ້າ​ຈາກ​ຕົວຢ່າງ​ສຽງ​ທີ່​ອ້າງອີງ​ໃດໆ

ສຽງ​ທຳມະຊາດ

ສຽງດົນຕີ, ແຮງດັນ, ແລະ ສຽງດັງທີ່ສົມບູນແບບ ດ້ວຍແບບແບບທີ່ອີງໃສ່ການແຜ່ກະຈາຍ.

ສຽງ​ແບບ​ຄລາສສິກ

ສ້າງສຽງແບບຄລາສສິກ ດ້ວຍຄວາມຖືກຕ້ອງ ແລະ ທໍາມະຊາດທີ່​ດີ.

​ການ​ຄິດໄລ່​ໄວ

ໄວກວ່າແບບຈໍາລອງ autoregressive ໃນຂະນະທີ່ຮັກສາຄຸນນະພາບ.

ແຫຼ່ງ​ເປີດ

MIT ອະນຸຍາດໃຫ້ໃຊ້ກັບສິດທິການໃຊ້ທຸລະກິດເຕັມ.

ກໍລະນີ​ໃຊ້

ອ່ານ​ປື້ມ​ສຽງ​ Premium ສຽງ​ເວົ້າ​ທີ່​ຊ່ຽວຊານ ການຜະລິດ​ຮູບເງົາ ແລະ ໂທລະພາບ ການໂຄສະນາ​ທີ່​ສູງ​ສຸດ ຜະລິດ​ Podcast ສຽງ​ສະແດງ

ແບບ TTS 2 Voices

View All 6
StyleTTS2 Default
EN
StyleTTS2 Expressive
EN
StyleTTS2 Fast
EN
StyleTTS2 Natural
EN
StyleTTS2 Neutral
EN
StyleTTS2 Quality
EN

ວິທີການ​ໃຊ້ ແບບ TTS 2

  1. 1

    ລົງທະບຽນຟຣີ ຫຼື ແລ່ນ​ການ​ທົດລອງ

    ສ້າງບັນຊີ TextToSpeechAI ຟຣີ ເພື່ອ​ຮັບ​ເງິນ​ຝາກ​ເລີ່ມຕົ້ນ ຫຼື ໃຊ້​ເວບ​ໄຊ​ທ໌​ທົດລອງ​ເພື່ອ​ຟັງ StyleTTS2 ໂດຍບໍ່​ຕ້ອງ​ເຂົ້າ​ສູ່​ລະບົບ.

  2. 2

    ເລືອກ​ເຄື່ອງຈັກ StyleTTS2

    ເລືອກ​ສຽງ StyleTTS2 ຈາກ​ຫໍສະໝຸດ​ສຽງ. ເພື່ອ​ klon ສຽງ, ສົ່ງ​ຄລິບ​ອ້າງອີງ​ທີ່​ມີ​ເວລາ 10- 30 ວິນາທີ ແລະ StyleTTS2 ຈະ​ໂອນ​ແບບ​ຂອງ​ມັນ​ໄປ​ໃຫ້​ມັນ.

  3. 3

    បញ្ចូល​ຂໍ້ຄວາມ​ຂອງ​ທ່ານ

    ປ້າຍ ຫຼື ພິມ​ສະຄິບ​ທີ່​ທ່ານ​ຕ້ອງການ​ໃຫ້​ເວົ້າ​ອອກ​ມາ & # 160; ។ StyleTTS2 ດີ​ທີ່​ສຸດ​ໃນ​ພາສາ​ອັງກິດ ແລະ ສົ່ງ​ການ​ເວົ້າ​ແບບ​ທຳມະຊາດ, ແຮງ​ກົດ ແລະ ສຽງ​ຜ່ານ​ຂໍ້​ຄວາມ​ຍາວໆ & # 160; ។

  4. 4

    ສ້າງ​ສຽງ

    ກົດສ້າງແລະ TextToSpeechAI ສະແດງສຽງ StyleTTS2 ຂອງທ່ານໃນ GPU. ລະດັບສູງ StyleTTS2 ຄ່າໃຊ້ຈ່າຍ 50 ສິນເຊື່ອຕໍ່ 1000 ຕົວອັກສອນ.

  5. 5

    ດາວໂຫລດ ຫຼື ໃຊ້ API

    ດາວໂຫລດ StyleTTS2 ສຽງສໍາເລັດເປັນ MP3, WAV, ຫຼື OGG, ຫຼືໂທ TextToSpeechAI API ກັບສຽງ StyleTTS2 ຂອງທ່ານເພື່ອສ້າງອັດຕະໂນມັດ.

ແບບ TTS 2 API

ສ້າງການເວົ້າໂດຍໃຊ້ໂປຣແກຣມໂດຍໃຊ້ TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "StyleTTS2ຜະລິດ​ການ​ເວົ້າ​ທີ່​ເປັນ​ທໍາມະຊາດ, ມັນ​ແຂ່ງ​ຂັນ​ກັບ​ການ​ບັນທຶກ​ຂອງ​ຄົນ​ທີ່​ມີ​ຄວາມ​ຊ່ຽວຊານ.",
    "voice": "styletts2-default"
  }'

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

StyleTTS2 ແມ່ນ​ແບບ​ແບບ​ຂໍ້​ຄວາມ​ໄປ​ຫາ​ການ​ເວົ້າ​ທີ່​ທັນ​ສະໄໝ​ທີ່​ສາມາດ​ບັນລຸ​ການ​ປະສົມ​ສຽງ​ໃນ​ລະດັບ​ມະນຸດ​ໄດ້. ມັນ​ໃຊ້​ການ​ແຜ່​ກະຈາຍ​ແບບ ແລະ ການ​ຝຶກ​ອົບຮົມ​ເພື່ອ​ຜະລິດ​ການ​ເວົ້າ​ທີ່​ບໍ່​ສາມາດ​ແຍກ​ອອກ​ຈາກ​ການ​ບັນທຶກ​ຂອງ​ມະນຸດ​ທີ່​ຈິງ​ໃນ​ການ​ທົດສອບ​ການ​ຟັງ​ທີ່​ບັງ​ເອີນ​ໄດ້. ທ່ານ​ສາມາດ​ທົດລອງ​ໃຊ້ StyleTTS2 ຟຣີ​ຢູ່​ທີ່ TextToSpeechAI.

StyleTTS2 ຜະລິດສຽງ TTS ທີ່ມີຄຸນນະພາບສູງທີ່ສຸດທີ່ໃຊ້ໄດ້ກັບ TextToSpeechAI. ໃນການທົດສອບແບບທາງການມັນໄດ້ບັນລຸການຕີລາຄາລະດັບມະນຸດໃນການທົດສອບ MOS (Mean Opinion Score), ເຊິ່ງຜູ້ຟັງບໍ່ສາມາດແຍກມັນຈາກຜູ້ເວົ້າມະນຸດທີ່ແທ້ຈິງ. ມັນຕັ້ງຢູ່ໃນລະດັບ Ultra ຂອງພວກເຮົາພ້ອມກັບ Tortoise ສຳ ລັບເຫດຜົນນັ້ນ.

ຍອມຮັບ, StyleTTS2 ສະໜັບສະໜູນການ​ກັ່ນຕອງ​ສຽງ​ຜ່ານ​ການ​ໂອນ​ແບບ​ຟອມ​ສຽງ. ມັນ​ບໍ່​ພຽງແຕ່​ກັ່ນຕອງ​ສຽງ​ເທົ່ານັ້ນ ແຕ່​ຍັງ​ກັ່ນຕອງ​ແບບ​ຟອມ​ການ​ເວົ້າ, ​ຈັງຫວະ ແລະ ຄຸນ​ນະ​ພາບ​ຂອງ​ອາລົມ​ຈາກ​ຄລິບ​ທີ່​ອ້າງ​ອີງ​ອີກ​ດ້ວຍ. ສະຫນອງ​ສຽງ​ທີ່​ຈະ​ແຈ້ງ​ 10- 30 ວິນາທີ ສຳ​ລັບ​ການ​ກັ່ນຕອງ StyleTTS2 ທີ່​ຖືກຕ້ອງ​ທີ່ສຸດ.

ແມ່ນແລ້ວ. StyleTTS2 ຖືກປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດ MIT ທີ່ອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າຢ່າງເຕັມທີ່ໂດຍບໍ່ຕ້ອງເສຍຄ່າລິຂະສິດ. ເຮັດໃຫ້ມັນປອດໄພ ສຳ ລັບປື້ມສຽງ, ການໂຄສະນາ, ຮູບເງົາ, ແລະ ໂຄງການ StyleTTS2 ອື່ນໆທີ່ຜູ້ຊ່ຽວຊານອື່ນໆທີ່ສິດກ່ຽວຂ້ອງ.

StyleTTS2 ສະໜັບສະໜູນພາສາອັງກິດເປັນຕົ້ນຕໍ, ນັບຕັ້ງແຕ່ແບບ ຈຳລອງໄດ້ຖືກຝຶກສອນໃນກຸ່ມຂໍ້ມູນພາສາອັງກິດ. ຖ້າທ່ານຕ້ອງການຄຸນະພາບທີ່ຄ້າຍຄືກັນໃນພາສາຫຼາຍພາສາ, F5- TTS ເທິງ TextToSpeechAI ແມ່ນ ເໝາະ ສົມກວ່າໃນຂະນະທີ່ຍັງສະໜັບສະໜູນການກັ່ນຕອງສຽງ.

StyleTTS2 ມີ ໄວ ຜະລິດ ຢ່າງ ພໍສົມຄວນ. ມັນ ໄວ ກວ່າ ຫຼາຍ ກ່ວາ ແບບ ແບບ autoregressive ເຊັ່ນ Tortoise ແຕ່ ຊ້າກວ່າ ເຄື່ອງຈັກ ນ້ ຳ ໜັກ ເບົາ ເຊັ່ນ Piper. ຍ້ອນ ຄຸນ ນະ ພາບ ສູງ ແລະ ຄ່າ ຄິດໄລ່, StyleTTS2 ແມ່ນ ລາຄາ ໃນ ລະດັບ Ultra ຂອງພວກເຮົາ ແທນທີ່ຈະ ເປັນ ແບບ ເວລາ ຈິງ.

StyleTTS2 ຕ້ອງການ VRAM ປະມານ 4-6GB ເພື່ອການຄິດໄລ່. ມັນມີປະສິດທິພາບໃນການເກັບຂໍ້ມູນຫຼາຍກ່ວາ Bark ຫຼື Tortoise ໃນຂະນະທີ່ຜະລິດຜົນໄດ້ຮັບທີ່ມີຄຸນນະພາບສູງກວ່າ. ຢູ່ໃນ TextToSpeechAI ການປຸງແຕ່ງ StyleTTS2 ທັງຫມົດແລ່ນຢູ່ໃນ GPUs ຂອງພວກເຮົາ, ສະນັ້ນທ່ານບໍ່ຕ້ອງການຮາດແວໃດໆຂອງຕົວທ່ານເອງ.

StyleTTS2 ແມ່ນແບບ Ultra-tier ແລະມີຄ່າໃຊ້ຈ່າຍ 50 ຄະແນນຕໍ່ 1000 ຕົວອັກສອນໃນ TextToSpeechAI. ລາຄາປະກັນໄພນັ້ນສະແດງໃຫ້ເຫັນຄຸນນະພາບລະດັບມະນຸດແລະຊັບພະຍາກອນ GPU ທີ່ຕ້ອງການ. ແບບມາດຕະຖານເຊັ່ນ Piper ມີຄ່າໃຊ້ຈ່າຍ 10 ຄະແນນຕໍ່ 1000 ຕົວອັກສອນໂດຍກົງ.

ເລືອກ StyleTTS2 ເມື່ອ​ຄຸນນະພາບ​ສຽງ​ພາສາ​ອັງກິດ​ແມ່ນ​ບຸລິມະສິດ​ຕົ້ນຕໍ ແລະ ທ່ານ​ຕ້ອງການ​ຜົນ​ທີ່​ມີ​ສຽງ​ທີ່​ເປັນ​ທຳ​ມະ​ຊາດ​ທີ່ສຸດ. ເລືອກ F5- TTS ເມື່ອ​ທ່ານ​ຕ້ອງການ​ການ​ປະສົມ​ພາສາ​ຫຼາຍ​ພາສາ​ຢ່າງ​ໄວ​ວາ​ດ້ວຍ​ການ​ກັ່ນຕອງ​ສຽງ. ທັງ​ສອງ​ຊ່ອຍ​ກັ່ນຕອງ, ແຕ່ StyleTTS2 ແມ່ນ​ລະດັບ​ສູງ (50 ຄະແນນ) ໃນຂະນະທີ່ F5- TTS ແມ່ນ​ລະດັບ​ສູງ (25 ຄະແນນ).

StyleTTS2 ຜະລິດສຽງທີ່ມີຄຸນນະພາບສູງທີ່ 24kHz. ຜ່ານ TextToSpeechAI ທ່ານສາມາດດາວໂຫລດຜົນໄດ້ຮັບເປັນ MP3, WAV, ຫຼື OGG, ແລະພວກເຮົາໃຊ້ການເຂົ້າລະຫັດທີ່ມີຄຸນນະພາບສູງດັ່ງນັ້ນຄຸນນະພາບ StyleTTS2 ພິເສດແມ່ນຖືກຮັກສາໄວ້ໃນເອກະສານສຸດທ້າຍ.

ຍອມຮັບ. StyleTTS2 ສະໜັບສະໜູນ​ການ​ປັບ​ອັດຕາ​ການ​ເວົ້າ ແລະ ການ​ອອກແບບ​ການ​ໂອນ​ແບບ​ຂອງ​ມັນ​ຈະ​ອະນຸຍາດ​ໃຫ້​ທ່ານ​ສ້າງ​ຮູບ​ແບບ​ຂອງ​ການ​ເວົ້າ​ໂດຍ​ການ​ເລືອກ​ຄລິບ​ອ້າງອີງ​ທີ່​ແຕກ​ຕ່າງ​ກັນ. ການ​ເລືອກ​ສຽງ​ດ້ວຍ​ຈັງຫວະ ແລະ ​ອາລົມ​ທີ່​ທ່ານ​ຕ້ອງການ ເຮັດໃຫ້​ທ່ານ​ສາມາດ​ຄວບຄຸມ​ການ​ສົ່ງ​ອອກ StyleTTS2 ໄດ້​ດີ​ຂຶ້ນ.

ເລືອກສຽງ StyleTTS2 ຈາກຫໍສະໝຸດຂອງພວກເຮົາຫຼືອັບໂຫລດສຽງທີ່ອີງໃສ່ເພື່ອສ້າງສຽງທີ່ກິນ, ຈາກນັ້ນອ້າງອີງສຽງນັ້ນໃນຄໍາຮ້ອງຂໍ API ຂອງທ່ານ. TextToSpeechAI ຈັດການການປຸງແຕ່ງ GPU ທັງຫມົດແລະກັບຄືນໄປບ່ອນ URL ໃນການດາວໂຫລດກັບສຽງ StyleTTS2 ທີ່ມີຄ່າຂອງທ່ານ.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 4-6GB
  • Credits/1000 chars 50

Try ແບບ TTS 2 Now

Generate your first audio free. No credit card required.

Start Free