Tentang VIT
VITS (Inferensi VATS) adalah model TTS end-end yang menghasilkan pidato yang terdengar alami. Ini menggabungkan pengkodean otonasi variasi dengan pelatihan adversaria untuk sintesis yang efisien. VITS sangat baik untuk pemrosesan dan aplikasi yang membutuhkan kualitas dan kecepatan.
Fitur Kunci
Sintesis Cepat
Arsitektur akhir untuk generasi pidato cepat.
Pemrosesan Batch
Secara efisien proses beberapa teks secara bersamaan.
Tutur Kata Alam
Pelatihan VAE+GAN menghasilkan prosody alami dan irama.
Multi-Speaker
Model tunggal mendukung suara speaker yang banyak.
Efisien
Kurang memori dengan kinerja yang baik.
Sumber Terbuka
MIT punya lisensi untuk kasus apapun.
Gunakan Kasus
VIT Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENCara Menggunakan VIT
-
1
Daftar bebas atau coba demo
Create a free TextToSpeechAI account to get starter credits, or use the on-page demo to hear VITS before signing up.
-
2
Pilih suatu Suara atau Pembicara
Ramban perpustakaan suara dan pilih suara yang ditandai dengan lencana VITS. multi-pebicara VITS perpustakaan, termasuk VCTK speaker set, memungkinkan Anda memilih dari banyak suara yang berbeda.
-
3
Masukkan teks Anda
Ketik atau tempelkan teks yang ingin Anda sampaikan ke penyunting. VITS menangani bagian panjang dengan baik dan ideal untuk batch dan isi volume tinggi.
-
4
Buat audio
Karena VOT sangat cepat dan standar-tier (10 kredit per 1000 karakter), hasil kembali dengan harga murah.
-
5
Unduh atau gunakan API
Download the finished audio as MP3, WAV, or OGG, or call the same VITS voice through the TextToSpeechAI REST API to automate generation in your own application.
VIT API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS memberikan pidato yang cepat dan alami untuk aplikasi yang sangat besar.",
"voice": "vits-ljspeech"
}'
Pertanyaan yang Sering Diajukan
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10