เสียงสะดวกสบาย2Name
Premiumการคลุมเครือเสียงหลายภาษาแบบ Zero-shot ด้วยการสนับสนุนการสตรีม
เกี่ยวกับ เสียงสะดวกสบาย2Name
[Translation temporarily unavailable. Please try again.]
ตัวเลือกหลัก
การคอลลินเสียงแบบ Zero- Shot
โคลนเสียงใดๆ จาก 3-10 วินาที ของเสียงที่อ้างอิงด้วยความซื่อสัตย์สูง
หลายภาษา
สนับสนุนภาษาจีน, อังกฤษ, ญี่ปุ่น, เกาหลี, และคานโตน โดยใช้การสังเคราะห์ภาษาต่างๆ
รองรับการสตรีม
ระบบสตรีมแบบล่าช้าต่ำ สำหรับแอพพลิเคชั่นเวลาจริง และระบบอินเตอร์แอคทีฟ
เสียงธรรมชาติKCharselect unicode block name
โมเดลการพูดที่ทันสมัย ทำให้เสียงพูดเป็นธรรมชาติ ด้วยการพูดที่เหมาะสม
กรณีการใช้
วิธีการใช้ เสียงสะดวกสบาย2Name
-
1
ลงทะเบียนและเรียกร้องเงินฟรี
สร้างบัญชี TextToSpeechAI ฟรี เพื่อเรียกร้องเครดิตเริ่มต้นของคุณ หรือลองดู demo ก่อน ไม่ต้องการติดตั้ง GPU หรือ CosyVoice2 ภายในเครื่อง - ทุกอย่างทำงานบนโครงสร้างพื้นฐานของเรา
-
2
เลือกเสียงสะดวกสบาย2และเพิ่มคลิปที่อ้างถึง
เลือกใช้ CosyVoice2 เป็นเครื่องมือของคุณ จากนั้นโหลดการบันทึกที่ใช้ในการอ้างอิง 3- 10 วินาที ของเสียงที่คุณต้องการจะโคลน CosyVoice2 จะดึงคุณสมบัติของผู้พูดเพื่อโคลนหลายภาษาแบบ zero- shot
-
3
พิมพ์ข้อความในภาษาที่รองรับ
พิมพ์หรือปักหมุดสคริปต์ของคุณเป็นภาษาจีน, อังกฤษ, ญี่ปุ่น, เกาหลี หรือคานโตน CosyVoice2 สนับสนุนการสังเคราะห์ภาษาต่าง ๆ ดังนั้น เสียงที่ถูกโคลนจะพูดภาษาที่แตกต่างจากคลิปที่อ้างอิง
-
4
สร้างเสียงพูด
คลิกสร้าง และ CosyVoice2 จะสังเคราะห์เสียงตามธรรมชาติ หลายภาษา ในเสียงที่โคลน ปกติแล้วภายในไม่กี่วินาทีสำหรับข้อความสั้น ๆ การใช้ระดับพรีเมี่ยมมีค่าใช้จ่าย 25 เครดิตต่อ 1,000 อักขระ
-
5
ดาวน์โหลดหรือใช้ API
ดาวน์โหลดเสียงที่เสร็จสมบูรณ์เป็น MP3 หรือ WAV จากประวัติของคุณ หรืออัตโนมัติ CosyVoice2 โคลนเสียงที่ขนาดผ่าน TextToSpeechAI REST API
เสียงสะดวกสบาย2Name ตัวช่วยการใช้งาน
สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "คอซี่วอยซ์2ส่งเสียงพูดหลายภาษา ด้วยความสามารถในการโคลนเสียง",
"voice": "en_US-lessac-medium"
}'
คำถามที่ถามบ่อย
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25