GPT-SoVITS
PremiumKlon suara beberapa-shoot dengan output kualiti tertinggi
Tentang GPT-SoVITS
ing. It is a
Ciri-ciri Utama
Klon Suara Few-Shot
Klon sebarang suara dari 3-10 saat audio rujukan dengan transkripsi untuk kualiti terbaik.
Sintesis Linguistik
Latihan pada satu bahasa dan cipta percakapan dalam bahasa Cina, Inggeris, Jepun, Korea, atau Kantonis.
Kualiti Tertinggi
GPT-SoVITS konsisten menduduki antara model kloning suara kualiti tertinggi yang ada.
Sumber Terbuka
Penuh MIT dilesenkan dengan pembangunan komuniti aktif dan dokumentasi yang luas.
Gunakan Kes
Bagaimana untuk Guna GPT-SoVITS
-
1
Cipta akaun percuma atau buka demo
Daftar untuk TextToSpeechAI untuk menerima kredit pelancar percuma, atau lompat terus ke demo untuk mencuba GPT-SoVITS tanpa mendaftar diperlukan.
-
2
Pilih GPT-SoVITS dan muat naik klip rujukan
Pilih GPT-SoVITS sebagai enjin anda, kemudian muat naik klip rujukan 3-10 saat suara yang anda ingin klon. Menambah transkripsi klip itu memberikan klon yang bersih, tepat.
-
3
Masukkan teks anda
Taip atau tampal teks yang anda mahu diucapkan dalam suara klon. GPT-SoVITS menyokong Cina, Inggeris, Jepun, Korea, dan Kantonis, termasuk klon lintas-bahasa dari rujukan dalam bahasa lain.
-
4
Janakan audio
Klik cipta untuk menghantar kerja ke pelayan GPU kami. GPT-SoVITS mengekspresikan ucapan klon kualiti yang baik pada kelajuan sederhana, dengan 25 kredit dicaj per 1,000 aksara.
-
5
Muat turun atau guna API
Muat turun audio GPT-SoVITS anda sebagai fail, atau automatikkan penjanaan melalui API REST TextToSpeechAI pada api.texttospeechai.com untuk aliran kerja pengeluaran.
GPT-SoVITS API
Janakan ucapan secara program menggunakan API REST TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS menghasilkan klon suara kualiti tertinggi dari hanya beberapa saat audio.",
"voice": "en_US-lessac-medium"
}'
Soalan Lazim
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25