VITS
StandardTTS nhanh từ đầu đến cuối với giọng nói tự nhiên
Về VITS
-efficient, and highly-efficient neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
Tính năng chính
Tổng hợp nhanh
Kiến trúc từ đầu đến cuối cho sự sinh ra giọng nói nhanh chóng.
Xử lý hàng loạt
Xử lý nhiều văn bản cùng lúc một cách hiệu quả.
Tiếng nói tự nhiên
Huấn luyện VAE + GAN tạo ra giai điệu và nhịp điệu tự nhiên.
Nhiều loa
Mô hình đơn hỗ trợ nhiều giọng nói loa.
Hiệu quả
Bộ nhớ thấp với hiệu suất tốt.
Mã nguồn mở
MIT cấp phép cho bất kỳ trường hợp sử dụng nào.
Tình huống sử dụng
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENCách sử dụng VITS
-
1
Đăng ký miễn phí hoặc thử bản demo
Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi đầu, hoặc sử dụng bản demo trên trang để nghe VITS trước khi đăng ký.
-
2
Chọn giọng nói hay loa VITS
Tìm kiếm thư viện giọng nói và chọn giọng nói được đánh dấu bằng huy hiệu VITS. Thư viện VITS đa loa, bao gồm bộ loa VCTK, cho phép bạn chọn từ nhiều giọng nói khác nhau.
-
3
Nhập văn bản
Nhập hoặc dán văn bản bạn muốn nói vào trình biên tập. VITS xử lý tốt các đoạn dài và thích hợp cho nội dung nhiều và nhiều tập.
-
4
Tạo âm thanh
Nhấn vào tạo để tổng hợp lời nói bằng VITS. Vì VITS rất nhanh và cấp chuẩn (10 tín hiệu trên 1000 ký tự), kết quả sẽ trở lại nhanh chóng với chi phí thấp.
-
5
Tải xuống hoặc sử dụng API
Tải xuống âm thanh hoàn thành như MP3, WAV, hoặc OGG, hoặc gọi cùng một giọng nói VITS thông qua TextToSpeechAI REST API để tự động tạo ra trong ứng dụng của riêng bạn.
VITS API
Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS cung cấp giọng nói nhanh, tự nhiên cho các ứng dụng có số lượng lớn.",
"voice": "vits-ljspeech"
}'
Câu hỏi thường gặp
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10