VITS
StandardTTS Petang-ke-Petang Cepat dengan Percakapan Semulajadi
Tentang VITS
-efficient, and low-cost TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
Ciri-ciri Utama
Sintesis Cepat
Arkitektur akhir-ke-akhir untuk penjanaan percakapan pantas.
Pemprosesan Batch
Proseskan teks berbilang secara serentak dengan berkesan.
Perkataan semulajadi
Latihan VAE+GAN menghasilkan prosody dan irama semulajadi.
Penutur Berbilang
Model tunggal menyokong suara pembicara berbilang.
Efisien
Kesan memori rendah dengan prestasi yang baik.
Sumber Terbuka
MIT dilesenkan untuk sebarang kes penggunaan.
Gunakan Kes
VITS Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENBagaimana untuk Guna VITS
-
1
Daftar secara percuma atau cuba demo
Cipta akaun percuma TextToSpeechAI untuk mendapatkan kredit pelancaran, atau gunakan demo pada halaman untuk mendengar VITS sebelum mendaftar masuk.
-
2
Pilih suara atau pengerusi VITS
Layari pustaka suara dan pilih suara yang ditandakan dengan lencana VITS. Pustaka VITS multi-penyiar, termasuk set pembesar suara VCTK, membolehkan anda memilih dari banyak suara yang berbeza.
-
3
Masukkan teks anda
Taip atau tampal teks yang anda mahukan diucapkan ke editor. VITS mengendalikan laluan panjang dengan baik dan sesuai untuk kandungan berbilang dan bervolum tinggi.
-
4
Janakan audio
Klik cipta untuk sintesis percakapan dengan VITS. Kerana VITS sangat pantas dan aras piawai (10 kredit per 1000 aksara), hasil kembali dengan cepat dengan kos rendah.
-
5
Muat turun atau guna API
Muat turun audio yang siap sebagai MP3, WAV, atau OGG, atau panggil suara VITS yang sama melalui API REST TextToSpeechAI untuk meautomatkan penjanaan dalam aplikasi anda sendiri.
VITS API
Janakan ucapan secara program menggunakan API REST TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS memberikan ucapan yang cepat dan semulajadi untuk aplikasi bervolum tinggi.",
"voice": "vits-ljspeech"
}'
Soalan Lazim
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10