Khu vực
UltraKý âm thanh biểu cảm với cảm xúc và kiểm soát phong cách
Về Khu vực
s. It is a 1.6B parameter text-to-speech model that can be used to clone text from reference audio and to create a 1.6B parameter text-to-speech model. It is a 1.6B parameter text-to-speech model that can be used to clone text from reference audio and to create a 1.6B parameter text-to-speech model. It is a 1.6B parameter text-to-
Tính năng chính
Kiểm soát cảm xúc
Kiểm soát các cảm xúc nói: hạnh phúc, buồn bã, tức giận, sợ hãi, ngạc nhiên, ghê tởm và trung lập.
Ký âm
Sao chép bất kỳ giọng nói nào từ 5-30 giây âm thanh tham chiếu với độ chính xác cao.
Tiếng nói biểu cảm
Các tham số 1.6B tạo ra giọng nói biểu cảm cao với sự truyền đạt cảm xúc sắc nét.
Nhiều ngôn ngữ
Hỗ trợ tiếng Anh, Nhật Bản, Trung Quốc, Pháp, và Đức.
Tình huống sử dụng
Cách sử dụng Khu vực
-
1
Đăng ký hoặc mở bản thử nghiệm
Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi đầu, hoặc sử dụng bản demo không đăng ký để thử Zonos ngay lập tức.
-
2
Chọn bộ máy Zonos
Chọn Zonos từ bộ chọn giọng nói và mô hình. Để sao chép giọng nói, tải lên 5- 30 giây âm thanh tham chiếu sạch để Zonos có thể tương ứng với loa.
-
3
Nhập văn bản
Nhập hoặc dán văn bản bạn muốn nói. Zonos hoạt động trên tiếng Anh, Nhật, Trung Quốc, Pháp và Đức.
-
4
Chọn một cảm xúc và tạo ra
Chọn một trong bảy cảm xúc Zonos - trung tính, hạnh phúc, buồn bã, tức giận, sợ hãi, ngạc nhiên, hoặc ghê tởm - sau đó nhấn Generate để tạo ra lời nói biểu cảm trong tâm trạng đó.
-
5
Tải xuống hoặc sử dụng API
Chơi lại và tải về âm thanh hoàn thành, hoặc gọi cùng một động cơ Zonos theo chương trình thông qua TextToSpeechAI REST API cho các luồng công việc tự động.
Khu vực API
Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos tạo ra những lời nói biểu cảm đáng kinh ngạc với sự kiểm soát cảm xúc tinh tế.",
"voice": "en_US-lessac-medium"
}'
Câu hỏi thường gặp
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50