- Đúng vậy.
UltraTTS hướng đối thoại với sao chép giọng nói và âm thanh không nói
Về - Đúng vậy.
ing the most accurate text-to-speech results. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds
Tính năng chính
Tạo hộp thoại
Tạo các cuộc nói chuyện tự nhiên với nhiều người nói với giọng nói khác nhau và chuyển đổi.
Âm thanh không nói
Thêm [cười], [thở phào], [hó], (ngạt thở) cho biểu hiện paralinguistic tự nhiên.
Ký âm
Sao chép bất kỳ giọng nói nào từ 5-10 giây âm thanh tham chiếu cho lời nói cá nhân.
Tiếng nói tự nhiên
Các tham số 1.6B tạo ra các âm điệu và giọng điệu giao tiếp tự nhiên.
Tình huống sử dụng
Cách sử dụng - Đúng vậy.
-
1
Đăng ký miễn phí hoặc mở bản demo
Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi đầu, hoặc mở bản demo không đăng ký để thử Dia Dialog ngay lập tức.
-
2
Chọn bộ máy Dia
Trong bảng điều khiển TTS, chọn Dia từ danh sách động cơ. Dia là mô hình hướng đối thoại, cực cấp với hỗ trợ nhiều loa và sao chép giọng nói.
-
3
Viết một văn lệnh hộp thoại với các thẻ
Hãy viết bài nói chuyện của bạn bằng cách sử dụng [S1] và [S2] để đánh dấu mỗi lượt nói, và bỏ vào các thẻ không nói như [laughs], [sighs], [coughs], hoặc (gasps) nơi bạn muốn phản ứng tự nhiên.
-
4
Tạo âm thanh
Nhấn Create để gửi văn lệnh Dia của bạn đến GPU được lưu của chúng tôi. Dia sẽ hiển thị cuộc đối thoại hai người nói với lượt đi và các thẻ không nói của bạn vào một tập tin âm thanh duy nhất.
-
5
Tải xuống hoặc gọi API
Tải xuống hộp thoại hoàn thành theo định dạng bạn chọn, hoặc tự động hóa nó bằng cách đăng ký cùng một văn lệnh [S1]/[S2] cho API TextToSpeechAI với token tài khoản của bạn.
- Đúng vậy. API
Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Chào! Hôm nay các bạn thế nào? [cười] [S2] Tôi đang rất tốt, cảm ơn vì đã hỏi!",
"voice": "en_US-lessac-medium"
}'
Câu hỏi thường gặp
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50