เขต

Ultra

การโคลนเสียงที่แสดงออกด้วยอารมณ์และการควบคุมสไตล์

Medium ความเร็ว
Excellent คุณภาพ
ใช่ กำลังสร้างคอลลิน
5 ภาษา

เกี่ยวกับ เขต

s.

ตัวเลือกหลัก

ควบคุมอารมณ์

ควบคุมอารมณ์ในการพูด ความสุข ความเศร้าโศก โกรธ กลัว ประหลาดใจ ขยะแขยง และปราศจากอารมณ์

เสียง

โคลนเสียงใดๆ จาก 5-30 วินาทีของเสียงที่อ้างอิง ด้วยความซื่อสัตย์สูง

เสียงแสดงออกName

ตัวแปร 1.6B ผลิตเสียงที่แสดงออกได้ดี ด้วยอารมณ์ที่แตกต่างกัน

หลายภาษา

รองรับภาษาอังกฤษ ญี่ปุ่น จีน ฝรั่งเศส และเยอรมัน

กรณีการใช้

การสร้างเนื้อหาที่แสดงออกทางอารมณ์ เสียงตัวละครเกมที่มีอารมณ์Name คำบรรยายหนังสือเสียงพร้อมอารมณ์Name ประสบการณ์เสียงแบบโต้ตอบName

วิธีการใช้ เขต

  1. 1

    ลงทะเบียนหรือเปิดตัวอย่าง

    สร้างบัญชีฟรี TextToSpeechAI เพื่อรับเครดิตเริ่มต้น หรือใช้ demo ไม่สมัครเพื่อทดลอง Zonos ตอนนี้

  2. 2

    เลือกเครื่องมือ Zonos

    เลือก Zonos จากตัวเลือกเสียงและแบบจำลอง เพื่อคลอนเสียง ให้โหลดเสียงอ้างอิงที่สะอาดไว้ 5- 30 วินาที เพื่อที่ Zonos จะสามารถทำการจับคู่กับตัวเล่าเรื่องได้

  3. 3

    พิมพ์ข้อความของคุณ

    พิมพ์หรือปักหมุดสคริปต์ที่คุณต้องการให้พูด Zonos ทำงานได้กับภาษาอังกฤษ ญี่ปุ่น จีน ฝรั่งเศส และเยอรมัน

  4. 4

    เลือกอารมณ์และสร้าง

    เลือกอารมณ์หนึ่งในอารมณ์7อารมณ์ของโซโน - ความเป็นกลาง ความสุข ความเศร้าโศก ความโกรธ ความกลัว ความประหลาดใจ หรือความขี้เกียจ - แล้วคลิกที่สร้าง เพื่อสร้างเสียงที่แสดงอารมณ์นั้น

  5. 5

    ดาวน์โหลดหรือใช้ API

    เพลงและดาวน์โหลดเสียงที่เสร็จสมบูรณ์ หรือเรียกเครื่องยนต์ Zonos เดียวกันโดยโปรแกรมผ่าน TextToSpeechAI REST API สำหรับกระบวนการทำงานอัตโนมัติ

เขต ตัวช่วยการใช้งาน

สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "โซโนสสร้างเสียงพูดที่แสดงออกได้ ด้วยการควบคุมอารมณ์ที่ละเอียดอ่อน",
    "voice": "en_US-lessac-medium"
  }'

คำถามที่ถามบ่อย

Zonos เป็นโมเดล 1.6B พารามิเตอร์ ข้อความ-เป็น-คำพูด จาก Zyphra มันเป็นผู้เชี่ยวชาญในการสร้างคำพูดที่แสดงออก ด้วยการควบคุมอารมณ์ที่ละเอียดอ่อน และเสียงที่มีความซื่อสัตย์สูงบน TextToSpeechAI มันทำงานเป็นเครื่องยนต์อัลตรา-เลเวลสำหรับเสียงที่มีความละเอียดอ่อนที่สุด อารมณ์ที่อุดมสมบูรณ์

ใช่ โซโนสถูกปล่อยออกมาภายใต้ลิขสิทธิ์ Apache 2.0 ทั้งโค้ดและโมเดล ดังนั้นมันจึงสามารถใช้ได้ฟรีในผลิตภัณฑ์ทางการค้า โดยไม่มีการระบุหรือข้อจำกัดทางธุรกิจ

Zonos แสดงสภาพอารมณ์7สภาพ - ความเป็นกลาง, ความสุข, ความเศร้า, ความโกรธ, ความกลัว, ความประหลาดใจ และความขยะแขยง - ที่คุณเลือกก่อนที่จะสร้าง โมเดลจะส่งสัญญาณไปยังอารมณ์ที่เลือกไว้ โดยการเปลี่ยนเสียง, ความเร็ว และความยาว ดังนั้น ประโยคเดียวกันจะฟังดูมีความสุข หรือโกรธ นี่ทำให้ Zonos เหมาะสมสำหรับเสียงของตัวละคร และคำพูด ที่ต้องการอารมณ์เฉพาะ

ตัวเลือกอารมณ์7ตัว: ความสุข ความเศร้าโศก ความโกรธ ความกลัว ความประหลาดใจ และความขยะแขยง คุณสามารถเลือกหนึ่งตัวในแต่ละรุ่น เพื่อตั้งค่าเสียงอารมณ์ของคลิปทั้งหมด

ใช่ มันโคลนเสียงจาก 5-30 วินาทีของเสียงที่ใช้เป็นตัวอย่าง ดึงลักษณะของผู้พูดออกมา และทำการโคลนเสียงใหม่ คุณสามารถผสมการโคลนเสียงกับอารมณ์7อารมณ์ เพื่อให้เสียงโคลนเสียง มีความสุข โกรธ หรือกลัว

โซโนสใช้ภาษาได้ห้าภาษา อังกฤษ ญี่ปุ่น จีน ฝรั่งเศส และเยอรมัน ควบคุมอารมณ์และโคลนเสียง ทำงานได้ทุกภาษา

ตัวโซโนสทำงานด้วยความเร็วปานกลาง เพราะขนาดพารามิเตอร์ 1.6 บิต แลกเปลี่ยนการส่งผ่านแบบ raw กับการส่งออกแบบ excellent ที่มีการแสดงออกอย่างสูง คุณภาพเป็นหนึ่งในสิ่งที่ดีที่สุดสำหรับเสียงที่แสดงอารมณ์และโคลน ดังนั้นมันเหมาะกับการผลิตเสียงสุดท้ายมากกว่าการสร้างเสียงแบบ bulk real-time

Zonos ต้องการ VRAM 8GB หรือมากกว่าสำหรับโมเดลพารามิเตอร์ 1.6B ของมัน GPU ที่มีอย่างน้อย 10GB แนะนำให้ใช้สำหรับการทำงานที่สะดวกสบายเมื่อรวมการโคลนเสียงกับการควบคุมอารมณ์บน TextToSpeechAI ทั้งหมดนี้ทำงานบน GPU เบื้องหลังของเรา ดังนั้นคุณจึงไม่ต้องการฮาร์ดแวร์ของตัวเอง

Zonos เป็นเครื่องมืออัลตรา-เทียร์ คิดค่าบริการ 50 เครดิตต่อ 1,000 ตัวอักษร อัลตรา-เทียร์ สะท้อนให้เห็นถึงโมเดลขนาดใหญ่ และความสามารถในการโคลนอารมณ์ และความสามารถในการโคลน ระดับเดียวกันกับ StyleTTS2, Tortoise และ OpenVoice

ทั้งสองตัวนี้ให้การควบคุมสไตล์และอารมณ์ด้วยการคลาวด์เสียง Zonos จัดหาสภาพอารมณ์แยกต่างหาก7สภาพ และสถาปัตยกรรม 1.6B สมัยใหม่ ในขณะที่ OpenVoice จัดหาสไตล์เสียง เช่น มิตร, สุขใจ และกระซิบกระซาบ ด้วยการคลาวด์ทันทีอย่างรวดเร็วมาก เลือก Zonos เมื่อคุณต้องการเลือกอารมณ์อย่างชัดเจน และแสดงออกอย่างมากที่สุด เลือก OpenVoice สำหรับการเปลี่ยนโทนเสียงที่เบากว่าและเร็วกว่า

Bark เพิ่มตัวบ่งบอกความรู้สึก เช่น [หัวเราะ] และ [ถอนหายใจ] แต่ให้การโคลนแบบจำกัด และ Dia เน้นการสนทนาหลายคนด้วยเสียงที่ไม่ใช้คำพูด Zonos เน้นการเลือกอารมณ์ที่ชัดเจน และการโคลนเสียงเดียวที่แข็งแกร่ง ทำให้คุณสามารถควบคุมอารมณ์ของคลิปได้ เลือกเครื่องจักรที่เหมาะสม หากคุณต้องการแท็กอารมณ์ การเปลี่ยนบทสนทนา หรืออารมณ์ที่เลือกได้

ใช่ บัญชีใหม่ TextToSpeechAI จะได้รับเครดิตเริ่มต้นฟรี และ demo ทำให้คุณสามารถสร้างตัวอย่างเสียงโดยไม่ต้องลงทะเบียน นั่นเพียงพอที่จะทดสอบการควบคุมอารมณ์ของ Zonos และโคลนเสียงก่อนที่จะซื้อเครดิตเพิ่มเติม

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try เขต Now

Generate your first audio free. No credit card required.

Start Free