กล่องคุยName

Premium

การโคลนเสียงแบบ Zero-shot ด้วยการพูดที่แสดงออกใน 23 ภาษา

Fast ความเร็ว
Very Good คุณภาพ
ใช่ กำลังสร้างคอลลิน
23 ภาษา

เกี่ยวกับ กล่องคุยName

[Translation temporarily unavailable. Please try again.]

ตัวเลือกหลัก

การคอลลินเสียงแบบ Zero- Shot

โคลนเสียงใดๆ จากเสียงไม่กี่วินาที - ไม่ต้องฝึกฝน

ภาษา

จากอาหรับไปจนถึงจีน ปกคลุมภาษาหลักๆของโลก

แท็กแสดงความคิดเห็น

เพิ่มเสียงหัวเราะ ไอ หายใจ และหัวเราะ สำหรับเสียงธรรมชาติ

คำนวณเร็ว

ความล่าช้าต่ำกว่า 200 วินาที กับรุ่นทอร์โบสำหรับแอพพลิเคชั่นเวลาจริง

กรณีการใช้

การคล้ายเสียงเพื่อสร้างเนื้อหา โปรแกรมเสียงหลายภาษาName การออกแบบเสียงตัวละครสำหรับเกมName ผู้ช่วยเสียงที่ปรับแต่งได้

วิธีการใช้ กล่องคุยName

  1. 1

    ลงทะเบียนหรือเปิดตัวอย่าง

    สร้างบัญชี TextToSpeechAI ฟรี เพื่อเรียกร้อง 200 เริ่มต้นเครดิต หรือใช้บนหน้า demo เพื่อทดสอบ Chatterbox โดยไม่ต้องเข้าสู่ระบบ

  2. 2

    เลือก Chatterbox และเพิ่มคลิปที่อ้างถึง

    เลือกเครื่องมือ Chatterbox แล้วโหลดคลิปเสียงสั้น ๆ (ไม่กี่วินาที) ของเสียงที่คุณต้องการโคลน Chatterbox zero- shot โคลนเสียงในทันที - ไม่จำเป็นต้องฝึก

  3. 3

    พิมพ์ข้อความของคุณด้วยแท็กที่เลือกได้

    พิมพ์หรือปักหมุดข้อความที่จะพูดในภาษาใดๆ หนึ่งใน 23 ภาษาที่รองรับ และวางแท็ก [laugh], [cough] หรือ [chuckle] ไว้ที่ที่คุณต้องการให้เสียงออกมา

  4. 4

    สร้างเสียงพูด

    คลิกสร้าง และ TextToSpeechAI จะแสดงข้อความของคุณ ในเสียง Chatterbox ที่โคลนบนโครงสร้างพื้นฐาน GPU ที่ใช้ 25 เครดิตต่อ 1,000 อักขระ

  5. 5

    ดาวน์โหลดหรือใช้ API

    ดาวน์โหลดแฟ้มเสียงที่เสร็จสมบูรณ์ หรืออัตโนมัติสร้างผ่าน TextToSpeechAI REST API ที่ api.texttospeechai.com ใช้โทเค็นบัญชีของคุณ

กล่องคุยName ตัวช่วยการใช้งาน

สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ชาเตอร์บ็อกซ์สามารถโคลนเสียงคุณได้ จากเสียงเพียงไม่กี่วินาที และพูดภาษา 23 ภาษา",
    "voice": "en_US-lessac-medium"
  }'

คำถามที่ถามบ่อย

Chatterbox เป็นโมเดลการโคลนเสียงแบบ zero-shot แบบข้อความ-เป็น-คำพูดจาก Resemble AI มันสามารถทำซ้ำเสียงใดๆ จากเพียงไม่กี่วินาทีของเสียงอ้างอิง และสร้างการพูดที่แสดงออกอย่างเป็นธรรมชาติใน 23 ภาษา โดยไม่ต้องฝึกเสียง

ใช่ Chatterbox ได้รับการอนุมัติจาก MIT อย่างเต็มที่ ทั้งโค้ดและน้ำหนักของโมเดล - ดังนั้นคุณสามารถใช้มันได้ฟรีในผลิตภัณฑ์ทางการค้า เสียงที่สร้างขึ้นรวมถึงการเลือกของ น้ำหอมของประสาทที่สามารถปิดการใช้งานได้ และไม่มีค่าใช้จ่ายในการใช้

คุณสามารถให้คลิปอ้างอิงของเสียงใด ๆ เพียงไม่กี่วินาที และ Chatterbox จะดึงเสียงและสไตล์ของเสียงนั้นเข้าไปในการฝังเสียงของผู้พูด จากนั้นมันจะสร้างการพูดใหม่ในเสียงนั้น โดยไม่ต้องปรับแต่งหรือฝึกขั้นตอน หมายความว่า "zero-shot"

Chatterbox จะอ่านแท็กพิเศษในข้อความของคุณ เพื่อเพิ่มเสียงที่ไม่ใช้คำพูดตามธรรมชาติ เช่น [laugh] แทรกเสียงหัวเราะ, [cough] แทรกเสียงหอบ และ [chuckle] แทรกเสียงหัวเราะเบา ๆ แค่วางแท็กที่ที่คุณต้องการให้เสียงดัง เช่น "มันตลกดี [laugh] แต่จริงจัง..."

พิมพ์แท็กโดยตรงเข้าไปในข้อความที่คุณป้อน ณ จุดที่เสียงควรจะเกิดขึ้น และถูกล้อมรอบด้วยประโยคที่เหลือ Chatterbox จะแสดงเสียงที่คล้ายกับภาษาในเสียงที่ถูกคลอน, ผสมมันเข้ากับเสียงที่อยู่รอบๆ ดังนั้น มันจะฟังดูเหมือนเป็นเสียงที่เกิดจากความคิดของตัวเอง มากกว่าเสียงที่ถูกสลับเข้าไป

Chatterbox รองรับภาษา 23 ภาษา ได้แก่ อารบิก, เดนมาร์ก, เยอรมัน, กรีก, อังกฤษ, สเปน, ฟินแลนด์, ฝรั่งเศส, ฮีบรู, ฮินดี, อิตาลี, ญี่ปุ่น, เกาหลี, มาเลเซีย, ดัตช์, นอร์เวย์, โปแลนด์, โปรตุเกส, รัสเซีย, สวีเดน, สวาวีลี, ตุรกี และจีน เสียงโคลนเดียวสามารถพูดได้ทั้งภาษาเหล่านี้

Chatterbox สร้างเสียงพูดได้เร็วบน GPU และรุ่น Turbo สามารถใช้ได้ในเวลาไม่ถึง 200 วินาที สำหรับการใช้ในการสนทนาในเวลาจริง คุณภาพดีมาก เสียงพูดเป็นธรรมชาติ และเสียงที่ตรงกับความเป็นจริง ถึงแม้จะใช้คลิปอ้างอิงที่ยาว

Chatterbox ต้องการ VRAM ประมาณ 4- 8GB ขึ้นอยู่กับรุ่น รุ่น Turbo ใช้ได้เพียง 4GB บน TextToSpeechAI คุณไม่ต้องการ GPU ภายในเครื่อง - รุ่นนี้ทำงานบนโครงสร้างพื้นฐานที่เราโฮสต์ไว้

Chatterbox เป็นเครื่องมือระดับพรีเมี่ยม ที่ใช้เงิน 25 เครดิตต่อ 1,000 ตัวอักษร บัญชีใหม่ได้รับ 200 เครดิตฟรี เพื่อลองโคลนเสียง และคุณใช้เครดิตเฉพาะในข้อความที่คุณสร้างขึ้นจริงๆ

ทั้งสองตัวนี้สนับสนุนการโคลนเสียงแบบ zero- shot แต่ Chatterbox รองรับภาษามากขึ้น (23 ต่อ2) และเพิ่มแท็กการแสดงออกทางภาษา F5- TTS สามารถทำให้เสียงอังกฤษเป็นธรรมชาติมากขึ้นนิดหน่อย ดังนั้นเลือก Chatterbox สำหรับโคลนเสียงหลายภาษาและเสียงแสดงออก และ F5- TTS สำหรับเสียงอังกฤษเท่านั้น

ทั้งสองตัวนี้ให้การโคลนเสียงที่มีคุณภาพสูง Chatterbox รองรับภาษา 23 ภาษา และแท็กแสดงออกทางภาษาในบรรทัด ในขณะที่ OpenVoice เพิ่มการควบคุมสไตล์เสียง (มิตร, เศร้า, โกรธ และอื่น ๆ) ที่ Chatterbox ขาดหายไป เลือก Chatterbox สำหรับภาษาที่ครอบคลุมมากขึ้น และ OpenVoice เมื่อคุณต้องการสไตล์เสียงที่แสดงอารมณ์อย่างชัดเจน

ใช่ ลงทะเบียนเพื่อรับบัญชี TextToSpeechAI ฟรี เพื่อรับเครดิตเริ่มต้น 200 หรือใช้หน้า demo เพื่อฟัง Chatterbox โดยไม่ต้องล็อกอิน อัพโหลดคลิปอ้างอิงสั้น ๆ พิมพ์ข้อความของคุณ และสร้างเสียงโคลนในไม่กี่วินาที

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try กล่องคุยName Now

Generate your first audio free. No credit card required.

Start Free