เกี่ยวกับ เขา
ing the most accurate text-to-speech results. Dia is also capable of generating natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results. Dia is also capable of generating natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results.
ตัวเลือกหลัก
สร้างกล่องโต้ตอบ
สร้างการสนทนาแบบธรรมชาติ ด้วยเสียงที่แตกต่างกัน และการเปลี่ยนแปลง
เสียงที่ไม่ใช้คำพูดKCharselect unicode block name
เพิ่ม [หัวเราะ] [ถอนหายใจ] [หอบหืด] [หายใจ] สำหรับการแสดงออกทางภาษาธรรมชาติ
เสียง
โคลนเสียงใดๆ จาก 5-10 วินาทีของเสียงอ้างอิง สำหรับคำพูดที่แตกต่างกัน
คุยกันตามธรรมชาติ
1.6B พารามิเตอร์ผลิต พูดคุยอย่างเป็นธรรมชาติมาก เสียงและอินโทเนชั่น
กรณีการใช้
วิธีการใช้ เขา
-
1
ลงทะเบียนฟรีหรือเปิดตัวอย่าง
สร้างบัญชี TextToSpeechAI ฟรี เพื่อเรียกร้อง เครดิตเริ่มต้นของคุณ หรือเปิด demo ไม่สมัคร เพื่อลอง ดิอา ดิอาโกลโก
-
2
เลือกเครื่องมือ Dia
ในแผงควบคุม TTS เลือก Dia จากรายการกลไก Dia เป็นโมเดลที่เน้นการสนทนา แบบอัลตราเลเวล รองรับเสียงหลายตัว และเสียงคล้ายกัน
-
3
เขียนสคริปต์กล่องโต้ตอบด้วยแท็ก
เขียนบทสนทนาของคุณโดยใช้ [S1] และ [S2] เพื่อระบุการเปลี่ยนตัวผู้พูด และวางแท็กที่ไม่ใช้คำพูด เช่น [หัวเราะ], [ถอนหายใจ], [หอบ] หรือ (หายใจลึกๆ) ไว้ที่ที่คุณต้องการให้เกิดปฏิกิริยาตามธรรมชาติ
-
4
สร้างเสียง
คลิกที่ สร้าง เพื่อส่งสคริปต์ Dia ของคุณไปยัง GPU ที่เราโฮสต์ Dia จะแสดงการสนทนาระหว่างผู้พูดสองคนด้วยการเปลี่ยนตำแหน่ง และแท็กที่ไม่ใช้คำพูดของคุณ เป็นแฟ้มเสียงเดียว
-
5
ดาวน์โหลดหรือเรียกใช้ API
ดาวน์โหลดกล่องโต้ตอบที่เสร็จสมบูรณ์ในรูปแบบที่คุณเลือก หรืออัตโนมัติโดยการโพสต์สคริปต์ [S1] / [S2] เดียวกันไปยัง API TextToSpeechAI ด้วยตัวแทนบัญชีของคุณ
เขา ตัวช่วยการใช้งาน
สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "สวัสดีค่ะ วันนี้เป็นไงบ้าง ฉันทำได้ดีมาก ขอบคุณที่ถาม",
"voice": "en_US-lessac-medium"
}'
คำถามที่ถามบ่อย
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50