Giọng ấm áp2
PremiumBản sao giọng nói đa ngôn ngữ Zero-shot với hỗ trợ stream
Về Giọng ấm áp2
[Translation temporarily unavailable. Please try again.]
Tính năng chính
Kiểu giọng Zero- Shot
Sao chép bất kỳ giọng nói nào từ 3-10 giây âm thanh tham chiếu với độ chính xác cao.
Nhiều ngôn ngữ
Hỗ trợ tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Hàn, và tiếng Quảng Đông với tổng hợp đa ngôn ngữ.
Hỗ trợ truyền tải
Chế độ truyền tải chậm thấp cho các ứng dụng thời gian thực và hệ thống tương tác.
Tự nhiên
Mô hình prosody tiên tiến tạo ra giọng nói âm thanh tự nhiên với giọng điệu phù hợp.
Tình huống sử dụng
Cách sử dụng Giọng ấm áp2
-
1
Đăng ký và nhận tiền thưởng miễn phí
Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng, hoặc thử bản demo trước. Không cần thiết cài đặt GPU hay CosyVoice2 địa phương - mọi thứ chạy trên cơ sở hạ tầng của chúng tôi.
-
2
Chọn CosyVoice2 và thêm đoạn trích tham chiếu
Chọn CosyVoice2 làm động cơ, sau đó tải lên một bản ghi tham khảo sạch 3- 10 giây của giọng nói bạn muốn nhân bản. CosyVoice2 sẽ trích xuất đặc điểm của người nói cho việc nhân bản đa ngôn ngữ không cần chụp ảnh.
-
3
Nhập văn bản bằng bất kỳ ngôn ngữ nào được hỗ trợ
Nhập hoặc dán văn bản bằng tiếng Trung, Anh, Nhật, Hàn, hoặc Quảng Đông. CosyVoice2 hỗ trợ tổng hợp đa ngôn ngữ, vì vậy giọng nói nhân bản có thể nói một ngôn ngữ khác với đoạn phim tham chiếu.
-
4
Tạo lời nói
Click generate và CosyVoice2 tổng hợp lời nói tự nhiên, đa ngôn ngữ trong giọng nói nhân bản, thường trong vòng vài giây cho văn bản ngắn.
-
5
Tải xuống hoặc sử dụng API
Tải xuống âm thanh hoàn thành như MP3 hoặc WAV từ lịch sử của bạn, hoặc tự động hóa CosyVoice2 voice clone trên quy mô thông qua TextToSpeechAI REST API.
Giọng ấm áp2 API
Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 cung cấp lời nói đa ngôn ngữ tự nhiên với khả năng sao chép giọng nói zero\u002Dshot.",
"voice": "en_US-lessac-medium"
}'
Câu hỏi thường gặp
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25