เขต

Ultra

การโคลนเสียงที่แสดงออกด้วยอารมณ์และการควบคุมสไตล์

ลองใช้ฟรี เขต เลือกเสียง (0)

Medium ความเร็ว

Excellent คุณภาพ

ใช่ กำลังสร้างคอลลิน

5 ภาษา

เกี่ยวกับ เขต

ตัวเลือกหลัก

ควบคุมอารมณ์

ควบคุมอารมณ์ในการพูด ความสุข ความเศร้าโศก โกรธ กลัว ประหลาดใจ ขยะแขยง และปราศจากอารมณ์

เสียง

โคลนเสียงใดๆ จาก 5-30 วินาทีของเสียงที่อ้างอิง ด้วยความซื่อสัตย์สูง

เสียงแสดงออกName

ตัวแปร 1.6B ผลิตเสียงที่แสดงออกได้ดี ด้วยอารมณ์ที่แตกต่างกัน

หลายภาษา

รองรับภาษาอังกฤษ ญี่ปุ่น จีน ฝรั่งเศส และเยอรมัน

กรณีการใช้

การสร้างเนื้อหาที่แสดงออกทางอารมณ์ เสียงตัวละครเกมที่มีอารมณ์Name คำบรรยายหนังสือเสียงพร้อมอารมณ์Name ประสบการณ์เสียงแบบโต้ตอบName

วิธีการใช้ เขต

1

ลงทะเบียนหรือเปิดตัวอย่าง

สร้างบัญชีฟรี TextToSpeechAI เพื่อรับเครดิตเริ่มต้น หรือใช้ demo ไม่สมัครเพื่อทดลอง Zonos ตอนนี้
2

เลือกเครื่องมือ Zonos

เลือก Zonos จากตัวเลือกเสียงและแบบจำลอง เพื่อคลอนเสียง ให้โหลดเสียงอ้างอิงที่สะอาดไว้ 5- 30 วินาที เพื่อที่ Zonos จะสามารถทำการจับคู่กับตัวเล่าเรื่องได้
3

พิมพ์ข้อความของคุณ

พิมพ์หรือปักหมุดสคริปต์ที่คุณต้องการให้พูด Zonos ทำงานได้กับภาษาอังกฤษ ญี่ปุ่น จีน ฝรั่งเศส และเยอรมัน
4

เลือกอารมณ์และสร้าง

เลือกอารมณ์หนึ่งในอารมณ์7อารมณ์ของโซโน - ความเป็นกลาง ความสุข ความเศร้าโศก ความโกรธ ความกลัว ความประหลาดใจ หรือความขี้เกียจ - แล้วคลิกที่สร้าง เพื่อสร้างเสียงที่แสดงอารมณ์นั้น
5

ดาวน์โหลดหรือใช้ API

เพลงและดาวน์โหลดเสียงที่เสร็จสมบูรณ์ หรือเรียกเครื่องยนต์ Zonos เดียวกันโดยโปรแกรมผ่าน TextToSpeechAI REST API สำหรับกระบวนการทำงานอัตโนมัติ

เขต ตัวช่วยการใช้งาน

สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "โซโนสสร้างเสียงพูดที่แสดงออกได้ ด้วยการควบคุมอารมณ์ที่ละเอียดอ่อน",
    "voice": "en_US-lessac-medium"
  }'

อ่านเอกสาร API ดาวน์โหลดกุญแจ API ของคุณ

คำถามที่ถามบ่อย

Zonos เป็นโมเดล 1.6B พารามิเตอร์ ข้อความ-เป็น-คำพูด จาก Zyphra มันเป็นผู้เชี่ยวชาญในการสร้างคำพูดที่แสดงออก ด้วยการควบคุมอารมณ์ที่ละเอียดอ่อน และเสียงที่มีความซื่อสัตย์สูงบน TextToSpeechAI มันทำงานเป็นเครื่องยนต์อัลตรา-เลเวลสำหรับเสียงที่มีความละเอียดอ่อนที่สุด อารมณ์ที่อุดมสมบูรณ์

ใช่ โซโนสถูกปล่อยออกมาภายใต้ลิขสิทธิ์ Apache 2.0 ทั้งโค้ดและโมเดล ดังนั้นมันจึงสามารถใช้ได้ฟรีในผลิตภัณฑ์ทางการค้า โดยไม่มีการระบุหรือข้อจำกัดทางธุรกิจ

Zonos แสดงสภาพอารมณ์7สภาพ - ความเป็นกลาง, ความสุข, ความเศร้า, ความโกรธ, ความกลัว, ความประหลาดใจ และความขยะแขยง - ที่คุณเลือกก่อนที่จะสร้าง โมเดลจะส่งสัญญาณไปยังอารมณ์ที่เลือกไว้ โดยการเปลี่ยนเสียง, ความเร็ว และความยาว ดังนั้น ประโยคเดียวกันจะฟังดูมีความสุข หรือโกรธ นี่ทำให้ Zonos เหมาะสมสำหรับเสียงของตัวละคร และคำพูด ที่ต้องการอารมณ์เฉพาะ

ตัวเลือกอารมณ์7ตัว: ความสุข ความเศร้าโศก ความโกรธ ความกลัว ความประหลาดใจ และความขยะแขยง คุณสามารถเลือกหนึ่งตัวในแต่ละรุ่น เพื่อตั้งค่าเสียงอารมณ์ของคลิปทั้งหมด

ใช่ มันโคลนเสียงจาก 5-30 วินาทีของเสียงที่ใช้เป็นตัวอย่าง ดึงลักษณะของผู้พูดออกมา และทำการโคลนเสียงใหม่ คุณสามารถผสมการโคลนเสียงกับอารมณ์7อารมณ์ เพื่อให้เสียงโคลนเสียง มีความสุข โกรธ หรือกลัว

โซโนสใช้ภาษาได้ห้าภาษา อังกฤษ ญี่ปุ่น จีน ฝรั่งเศส และเยอรมัน ควบคุมอารมณ์และโคลนเสียง ทำงานได้ทุกภาษา

ตัวโซโนสทำงานด้วยความเร็วปานกลาง เพราะขนาดพารามิเตอร์ 1.6 บิต แลกเปลี่ยนการส่งผ่านแบบ raw กับการส่งออกแบบ excellent ที่มีการแสดงออกอย่างสูง คุณภาพเป็นหนึ่งในสิ่งที่ดีที่สุดสำหรับเสียงที่แสดงอารมณ์และโคลน ดังนั้นมันเหมาะกับการผลิตเสียงสุดท้ายมากกว่าการสร้างเสียงแบบ bulk real-time

Zonos ต้องการ VRAM 8GB หรือมากกว่าสำหรับโมเดลพารามิเตอร์ 1.6B ของมัน GPU ที่มีอย่างน้อย 10GB แนะนำให้ใช้สำหรับการทำงานที่สะดวกสบายเมื่อรวมการโคลนเสียงกับการควบคุมอารมณ์บน TextToSpeechAI ทั้งหมดนี้ทำงานบน GPU เบื้องหลังของเรา ดังนั้นคุณจึงไม่ต้องการฮาร์ดแวร์ของตัวเอง

Zonos เป็นเครื่องมืออัลตรา-เทียร์ คิดค่าบริการ 50 เครดิตต่อ 1,000 ตัวอักษร อัลตรา-เทียร์ สะท้อนให้เห็นถึงโมเดลขนาดใหญ่ และความสามารถในการโคลนอารมณ์ และความสามารถในการโคลน ระดับเดียวกันกับ StyleTTS2, Tortoise และ OpenVoice

ทั้งสองตัวนี้ให้การควบคุมสไตล์และอารมณ์ด้วยการคลาวด์เสียง Zonos จัดหาสภาพอารมณ์แยกต่างหาก7สภาพ และสถาปัตยกรรม 1.6B สมัยใหม่ ในขณะที่ OpenVoice จัดหาสไตล์เสียง เช่น มิตร, สุขใจ และกระซิบกระซาบ ด้วยการคลาวด์ทันทีอย่างรวดเร็วมาก เลือก Zonos เมื่อคุณต้องการเลือกอารมณ์อย่างชัดเจน และแสดงออกอย่างมากที่สุด เลือก OpenVoice สำหรับการเปลี่ยนโทนเสียงที่เบากว่าและเร็วกว่า

Bark เพิ่มตัวบ่งบอกความรู้สึก เช่น [หัวเราะ] และ [ถอนหายใจ] แต่ให้การโคลนแบบจำกัด และ Dia เน้นการสนทนาหลายคนด้วยเสียงที่ไม่ใช้คำพูด Zonos เน้นการเลือกอารมณ์ที่ชัดเจน และการโคลนเสียงเดียวที่แข็งแกร่ง ทำให้คุณสามารถควบคุมอารมณ์ของคลิปได้ เลือกเครื่องจักรที่เหมาะสม หากคุณต้องการแท็กอารมณ์ การเปลี่ยนบทสนทนา หรืออารมณ์ที่เลือกได้

ใช่ บัญชีใหม่ TextToSpeechAI จะได้รับเครดิตเริ่มต้นฟรี และ demo ทำให้คุณสามารถสร้างตัวอย่างเสียงโดยไม่ต้องลงทะเบียน นั่นเพียงพอที่จะทดสอบการควบคุมอารมณ์ของ Zonos และโคลนเสียงก่อนที่จะซื้อเครดิตเพิ่มเติม

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 5
GPU VRAM 8GB+
Credits/1000 chars 50

Try เขต Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

เขต

เกี่ยวกับ เขต

ตัวเลือกหลัก

ควบคุมอารมณ์

เสียง

เสียงแสดงออกName

หลายภาษา

กรณีการใช้

วิธีการใช้ เขต

ลงทะเบียนหรือเปิดตัวอย่าง

เลือกเครื่องมือ Zonos

พิมพ์ข้อความของคุณ

เลือกอารมณ์และสร้าง

ดาวน์โหลดหรือใช้ API

เขต ตัวช่วยการใช้งาน

คำถามที่ถามบ่อย

อะไรคือโซโนส TTS?

โซโนสเป็นของฟรีหรือเปล่า

ควบคุมอารมณ์ของโซโนสทำงานยังไง

โซโนสสนับสนุนอารมณ์อะไร

โซโนสโคลนเสียงไหม

ภาษาอะไรที่โซโนสสนับสนุน?

โซโนสเร็วแค่ไหน และคุณภาพดีแค่ไหน

หน่วยความจำ GPU เท่าไหร่ที่โซโนสต้องการ

ค่าโซโนส TextToSpeechAI เท่าไหร่

ฉันควรใช้อะไรดี

โซโนสแตกต่างจากบาร์คหรือดีอา ยังไง

ฉันลองโซโนสฟรีได้ไหม บน TextToSpeechAI

Technical Specs

Try เขต Now

Other TTS Engines

กระดาษ

กล่องคุยName

เสียงสะดวกสบาย2Name