GPT- SOVITS
PremiumNhân bản giọng nói với vài lần bấm với chất lượng xuất ra cao nhất
Về GPT- SOVITS
ing. It is a
Tính năng chính
Kiểu giọng nói
Clone bất kỳ giọng nói nào từ 3-10 giây của âm thanh tham khảo với một bản ghi cho chất lượng tốt nhất.
Tổng hợp Ngôn ngữ
Huấn luyện một ngôn ngữ và tạo ra lời nói bằng tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Hàn hoặc tiếng Quảng Đông.
Chất lượng cao nhất
GPT-SoVITS luôn xếp hạng trong số các mô hình sao chép giọng nói chất lượng cao nhất có sẵn.
Mã nguồn mở
Tất cả MIT giấy phép với phát triển cộng đồng hoạt động và tài liệu rộng rãi.
Tình huống sử dụng
Cách sử dụng GPT- SOVITS
-
1
Tạo tài khoản miễn phí hoặc mở bản thử nghiệm
Đăng ký cho TextToSpeechAI để nhận được tín dụng khởi động miễn phí, hoặc nhảy thẳng vào demo để thử GPT-SoVITS mà không cần đăng ký.
-
2
Chọn GPT-SoVITS và tải lên đoạn phim tham khảo
Chọn GPT- SoVITS làm động cơ, sau đó tải lên một đoạn ghi chú 3- 10 giây của giọng nói bạn muốn nhân bản. Thêm đoạn ghi chép của đoạn đó sẽ cho bạn một bản nhân chính xác nhất.
-
3
Nhập văn bản
Nhập hoặc dán văn bản bạn muốn nói trong giọng nói nhân bản. GPT- Sovits hỗ trợ tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Hàn và tiếng Quảng Đông, bao gồm nhân bản đa ngôn ngữ từ tham chiếu trong ngôn ngữ khác.
-
4
Tạo âm thanh
Nhấn Generate để gửi công việc đến máy chủ GPU của chúng tôi. GPT-SoVITS tạo ra giọng nói nhân bản chất lượng tốt với tốc độ trung bình, với 25 credit tính phí cho mỗi 1000 ký tự.
-
5
Tải xuống hoặc sử dụng API
Tải về âm thanh GPT-SoVITS hoàn thành như một tập tin, hoặc tự động tạo thông qua TextToSpeechAI REST API tại api.texttospeechai.com cho các luồng công việc sản xuất.
GPT- SOVITS API
Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS tạo ra bản sao giọng nói chất lượng cao nhất chỉ từ vài giây âm thanh.",
"voice": "en_US-lessac-medium"
}'
Câu hỏi thường gặp
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25