Pocket TTS

Standard

Kloning suara berpencahaya Ultra yang menjalankan real-time pada CPU

Very Fast Kecepatan
Good Kualitas
Ya Kloning
2 Bahasa

Tentang Pocket TTS

Pocket TTS oleh Kyutai adalah sebuah parameter super ringan 100M model teks-ke-peech yang berjalan dalam real-time pada CPU. Meskipun ukuran kecilnya, itu mendukung kloning suara dari hanya 5 detik dari audio referensi. Sempurna untuk penyebaran tepi, aplikasi bergerak, dan skenario di mana sumber daya GPU terbatas. Saat ini mendukung Inggris dan Perancis.

Fitur Kunci

Berat-liburan Ultra

Parameter 100M - dijalankan real-time pada CPU dengan sumber daya minimal.

Penuturan Suara

Kloning semua suara dari 5 detik saja dari referensi audio, bahkan pada CPU.

Real-Time di CPU

GPU tidak diperlukan. Hasilkan pidato pada kecepatan real-time pada perangkat keras standar.

Siap-Bayut

Cukup kecil untuk perangkat mobile, Raspberry Pi, dan sistem yang tertanam.

Gunakan Kasus

Tepi dan penyebaran mobile Asisten suara real-time di CPU Iot dan perangkat tertanam Kloning suara sumber-rendah

Cara Menggunakan Pocket TTS

  1. 1

    Daftar bebas atau coba demo

    Create a free TextToSpeechAI account to receive starter credits, or use the on-site demo to hear Pocket TTS before signing up. No GPU or local install is needed.

  2. 2

    Pilih Pocket TTS dan tambahkan suara ke klon

    Pilih Pocket TTS sebagai mesin Anda, kemudian upload klip referensi pendek sekitar 5 sampai 10 detik untuk mengkloning suara itu.

  3. 3

    Masukkan teks Anda

    Ketik atau tempelkan teks Inggris atau Perancis yang ingin Anda gunakan. perhatikan jumlah karakter, karena tagihan Pocket TTS pada tingkat standar 10 kredit per 1.000 karakter.

  4. 4

    Buat audio

    Klik hasilkan dan Pocket TTS mensintesis teks Anda dalam suara kloning dengan kecepatan real-time. Kebanyakan klip siap dalam hitungan detik karena model ini sangat kecil dan efisien CPU.

  5. 5

    Unduh atau gunakan API

    Download the finished audio, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com using your account token. The API exposes the same Pocket TTS cloning and synthesis for your own apps.

Pocket TTS API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS memberikan kloning suara yang berjalan dalam real\u002Dtime, bahkan pada CPU.",
    "voice": "en_US-lessac-medium"
  }'

Pertanyaan yang Sering Diajukan

Pocket TTS adalah model teks super ringan dari Kyutai dengan hanya 100 juta parameter. Ini berjalan dalam real-time pada CPU dan mendukung kloning suara dari 5 detik audio.

Pocket TTS dilisensikan di bawah CC-BY-4.0, yang memungkinkan penggunaan komersial dengan atribution. Anda harus kredit Kyutai ketika menggunakannya dalam aplikasi komersial.

Saat ini Pocket TTS mendukung bahasa Inggris dan Perancis, lebih banyak bahasa dapat ditambahkan dalam rilis mendatang.

Dengan hanya 100M parameter, Pocket TTS berjalan dengan kecepatan real-time pada perangkat keras CPU standar.

Baik ringan dan berjalan baik pada CPU. Pocket TTS unik mendukung kloning suara (Kokoro tidak). Kokoro mendukung lebih banyak bahasa (9 vs 2). Pilih Pocket TTS jika Anda membutuhkan cloning suara ringan, Kokoro jika Anda membutuhkan lebih banyak cakupan bahasa.

Menyediakan 5 detik audio referensi. Pocket TTS mengekstrak karakteristik pembicara dan dapat menghasilkan pidato baru dalam suara itu. Kualitas meningkatkan dengan referensi lebih panjang (sampai 10 detik).

Ya, tidak seperti model kloning yang memerlukan GPU, Pocket TTS melakukan kloning suara nol-shot sepenuhnya pada CPU berkat jejak kecil 100M-parameter. Anda dapat mengklon sebuah suara dari klip pendek bahkan pada laptop atau papan komputer tunggal.

Pocket TTS dirilis di bawah CC-BY-4.0, jadi Anda harus kredit Kyutai sebagai pencipta asli ketika Anda menggunakan atau mendistribusikannya. sebuah atribution sederhana seperti "Voice dihasilkan dengan Pocket TTS oleh Kyutai" satisfies lisensi untuk komersial dan non-komersial menggunakan sama.

Pocket TTS menghasilkan pidato secara real-time atau lebih cepat pada CPU standar, tanpa dibutuhkan GPU. Ini membuatnya menjadi salah satu mesin yang paling responsif untuk penggunaan rendah-latensi kasus seperti asisten suara hidup dan generasi pada perangkat.

Pocket TTS is in the standard pricing tier, costing 10 credits per 1,000 characters. That makes it one of the most economical voice-cloning options available on TextToSpeechAI.

Keduanya ringan, CPU-ramah, standar-tier mesin. Pilih Pocket TTS ketika Anda membutuhkan kloning suara, karena Kokoro tidak mendukungnya. Pilih Kokoro ketika Anda membutuhkan cakupan bahasa yang lebih luas dan tidak perlu mengkloning suara spesifik.

Yes. New TextToSpeechAI accounts receive free starter credits, and the on-site demo lets you hear Pocket TTS before committing. Sign up for free, upload a short reference clip, and generate cloned speech in seconds.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Pocket TTS Now

Generate your first audio free. No credit card required.

Start Free