Pocket TTS
StandardKloning suara berpencahaya Ultra yang menjalankan real-time pada CPU
Tentang Pocket TTS
Pocket TTS oleh Kyutai adalah sebuah parameter super ringan 100M model teks-ke-peech yang berjalan dalam real-time pada CPU. Meskipun ukuran kecilnya, itu mendukung kloning suara dari hanya 5 detik dari audio referensi. Sempurna untuk penyebaran tepi, aplikasi bergerak, dan skenario di mana sumber daya GPU terbatas. Saat ini mendukung Inggris dan Perancis.
Fitur Kunci
Berat-liburan Ultra
Parameter 100M - dijalankan real-time pada CPU dengan sumber daya minimal.
Penuturan Suara
Kloning semua suara dari 5 detik saja dari referensi audio, bahkan pada CPU.
Real-Time di CPU
GPU tidak diperlukan. Hasilkan pidato pada kecepatan real-time pada perangkat keras standar.
Siap-Bayut
Cukup kecil untuk perangkat mobile, Raspberry Pi, dan sistem yang tertanam.
Gunakan Kasus
Cara Menggunakan Pocket TTS
-
1
Daftar bebas atau coba demo
Create a free TextToSpeechAI account to receive starter credits, or use the on-site demo to hear Pocket TTS before signing up. No GPU or local install is needed.
-
2
Pilih Pocket TTS dan tambahkan suara ke klon
Pilih Pocket TTS sebagai mesin Anda, kemudian upload klip referensi pendek sekitar 5 sampai 10 detik untuk mengkloning suara itu.
-
3
Masukkan teks Anda
Ketik atau tempelkan teks Inggris atau Perancis yang ingin Anda gunakan. perhatikan jumlah karakter, karena tagihan Pocket TTS pada tingkat standar 10 kredit per 1.000 karakter.
-
4
Buat audio
Klik hasilkan dan Pocket TTS mensintesis teks Anda dalam suara kloning dengan kecepatan real-time. Kebanyakan klip siap dalam hitungan detik karena model ini sangat kecil dan efisien CPU.
-
5
Unduh atau gunakan API
Download the finished audio, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com using your account token. The API exposes the same Pocket TTS cloning and synthesis for your own apps.
Pocket TTS API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS memberikan kloning suara yang berjalan dalam real\u002Dtime, bahkan pada CPU.",
"voice": "en_US-lessac-medium"
}'
Pertanyaan yang Sering Diajukan
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10