เกี่ยวกับ วิทซ์
-efficient, and highly-efficient TTS model. It is designed to be used in the field of text-to-speech. It is based on the
ตัวเลือกหลัก
ปรับแต่งอัตโนมัติ
ระบบสถาปัตยกรรม สำหรับสร้างเสียงอย่างรวดเร็ว
ประมวลผลแบบบั๊ก
ประมวลผลข้อความหลายข้อพร้อมกันได้อย่างมีประสิทธิภาพ
เสียงธรรมชาติ
ฝึก VAE+GAN ทำให้เกิดเสียงและจังหวะตามธรรมชาติ
หลายตัว
โมเดลเดียว รองรับเสียงหลายเสียง
ประสิทธิภาพ
ใช้หน่วยความจำน้อย แต่ประสิทธิภาพดี
โอเพนซอร์ส
MIT อนุมัติให้ใช้ได้ทุกกรณี
กรณีการใช้
วิทซ์ Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENวิธีการใช้ วิทซ์
-
1
ลงทะเบียนฟรี หรือลองดู Demo
สร้างบัญชีฟรี TextToSpeechAI เพื่อรับเครดิตเริ่มต้น หรือใช้หน้า demo เพื่อฟัง VITS ก่อนที่จะสมัคร
-
2
เลือกเสียงหรือลำโพง VITS
คลิกที่ลิงค์ เลือกเสียงที่ถูกระบุด้วยป้าย VITS ลิงค์ VITS สำหรับเสียงหลายตัว รวมถึงชุดเสียง VCTK ช่วยให้คุณเลือกเสียงที่แตกต่างกันได้มากมาย
-
3
พิมพ์ข้อความของคุณ
พิมพ์หรือปะข้อความที่คุณต้องการให้พูดเข้าไปในตัวแก้ไข VITS สามารถจัดการข้อความยาวๆได้ดี และเหมาะสำหรับเนื้อหาที่ใช้บ่อยๆ และมีปริมาณมาก
-
4
สร้างเสียง
คลิกที่ สร้าง เพื่อสังเคราะห์เสียงด้วย VITS เพราะ VITS ทำงานเร็วมาก และเป็นระดับมาตรฐาน (10 เครดิตต่อ 1000 อักขระ) ผลลัพธ์จะกลับมาเร็ว และมีราคาถูก
-
5
ดาวน์โหลดหรือใช้ API
ดาวน์โหลดเสียงที่ได้มาเป็น MP3, WAV, หรือ OGG หรือเรียกเสียง VITS ผ่าน API REST TextToSpeechAI เพื่อสร้างเสียงอัตโนมัติในแอพพลิเคชันของคุณเอง
วิทซ์ ตัวช่วยการใช้งาน
สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS ช่วยให้การพูดเป็นธรรมชาติ สำหรับแอพพลิเคชั่นที่มีปริมาณสูง",
"voice": "vits-ljspeech"
}'
คำถามที่ถามบ่อย
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10