Kokoro
StandardLightning-cepat, ringan TTS dengan kualitas alami
Tentang Kokoro
Kokoro adalah sebuah parameter ultra ringan 8M TTS model yang memberikan pidato yang terdengar alami dengan kecepatan yang luar biasa. ia berjalan hampir real-time bahkan pada CPU, membuatnya ideal untuk aplikasi di mana latensi rendah kritis. Kokoro mendukung berbagai bahasa dan menawarkan kemampuan mencampur suara.
Fitur Kunci
Berat-liburan Ultra
Parameter 82M, ukuran model ~300MB. Jalankan CPU dengan sumber daya minimal.
Dekat Masa-Awal
Membuat pidato lebih cepat daripada kecepatan putar, bahkan tanpa akselerasi GPU.
Multi-Bahasa
Mendukung bahasa Inggris, Prancis, Spanyol, Hindi, Jepang, Cina, Italia, Portugis, dan Korea.
Suara Menempel
Campurkan dua suara bersama untuk menciptakan kombinasi suara yang unik.
Gunakan Kasus
Cara Menggunakan Kokoro
-
1
Daftar bebas atau coba demo
Create a free TextToSpeechAI account to get 200 starter credits, or use the no-signup demo to hear Kokoro instantly. The standard tier means Kokoro only costs 10 credits per 1000 characters.
-
2
Pilih suara Kokoro
Buka peramban suara dan pilih suara Kokoro dalam bahasa target Anda (9 didukung, dari Inggris ke Jepang dan Korea). Anda juga dapat menggunakan suara Kokororo untuk mencampur dua suara ke kombinasi ubahan.
-
3
Masukkan teks Anda
Ketik atau tempelkan teks yang ingin Anda sampaikan ke penyunting. Kokoro menangani bagian panjang secara efisien berkat ringan 82M-parameter, dekat mesin real-time.
-
4
Sesuaikan kecepatan dan hasilkan
Atur kecepatan putar untuk sesuai dengan huruf pakai Anda, lalu klik Generate. Kokoro membuat audio lebih cepat dari real-time, jadi pidato Anda segera siap.
-
5
Unduh atau gunakan API
Download the finished audio as MP3 or WAV, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com for batch and real-time workloads.
Kokoro API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro menyampaikan pidato alami dengan kecepatan dan efisiensi yang luar biasa.",
"voice": "en_US-lessac-medium"
}'
Pertanyaan yang Sering Diajukan
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10