Pocket TTS

Standard

Klon suara ultra-ringan yang berjalan masa nyata pada CPU

Very Fast Kelajuan
Good Kualiti
Ya Klon
2 Bahasa

Tentang Pocket TTS

Windows 10, 8.1, 8, 7, Vista, XP, and 2000. It is a 100M parameter text-to-speech model that runs on Windows 10, 8, 7, Vista, XP, and 2000. It is a 100M parameter text-to-speech model that runs on Windows 10, 8, and 7.

Ciri-ciri Utama

Ultra-Lightweight

Parameter 100M - berjalan masa nyata pada CPU dengan sumber minimum.

Klon Suara

Klon sebarang suara dari hanya 5 saat audio rujukan, bahkan pada CPU.

Masa- Real pada CPU

Tiada GPU diperlukan. Janakan percakapan pada kelajuan masa nyata pada perkakasan piawai.

Sedia-Tepi

Cukup kecil untuk peranti mudah alih, Raspberry Pi, dan sistem terbenam.

Gunakan Kes

Pelaksanaan Edge dan Mobile Pembantu suara masa-nyata pada CPU IoT dan peranti terbenam Klon suara sumber rendah

Bagaimana untuk Guna Pocket TTS

  1. 1

    Daftar secara percuma atau cuba demo

    Cipta akaun TextToSpeechAI percuma untuk menerima kredit permulaan, atau gunakan demo di tapak untuk mendengar Pocket TTS sebelum mendaftar masuk. Tiada GPU atau pemasangan setempat diperlukan.

  2. 2

    Pilih Pocket TTS dan tambah suara untuk klon

    Pilih Pocket TTS sebagai enjin anda, kemudian muat naik klip rujukan pendek kira-kira 5 hingga 10 saat untuk mengklon suara itu. Pocket TTS berjalan sepenuhnya pada CPU, jadi kloning adalah pantas dan ringan.

  3. 3

    Masukkan teks anda

    Taip atau tampal teks Inggeris atau Perancis yang anda mahu diucapkan. Awasi kiraan aksara, kerana Pocket TTS membayar pada kadar piawai 10 kredit per 1,000 aksara.

  4. 4

    Janakan audio

    Klik cipta dan Pocket TTS mensintesis teks anda dalam suara klon pada kelajuan masa nyata. Kebanyakan klip siap dalam beberapa saat kerana model sangat kecil dan efisien CPU.

  5. 5

    Muat turun atau guna API

    Muat turun audio yang siap, atau automatikkan penjanaan melalui API REST TextToSpeechAI pada api.texttospeechai.com menggunakan token akaun anda. API memaparkan kloning dan sintesis Pocket TTS yang sama untuk aplikasi anda sendiri.

Pocket TTS API

Janakan ucapan secara program menggunakan API REST TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS memberikan klon suara yang berjalan dalam masa nyata, bahkan pada CPU.",
    "voice": "en_US-lessac-medium"
  }'

Soalan Lazim

Pocket TTS adalah model teks-ke-tutur ultra-lembut dari Kyutai dengan hanya 100 juta parameter. Ia berjalan dalam masa nyata pada CPU dan menyokong klon suara dari 5 saat audio.

Pocket TTS dilesenkan di bawah CC-BY-4.0, yang membenarkan penggunaan komersial dengan pengakuan. Anda mesti memberi kredit kepada Kyutai apabila menggunakannya dalam aplikasi komersial.

Kini Pocket TTS menyokong bahasa Inggeris dan Perancis. Lebih bahasa mungkin ditambah dalam rilis masa depan.

Ya! Dengan parameter 100M sahaja, Pocket TTS berjalan pada kelajuan masa nyata pada perkakasan CPU piawai. Tiada GPU diperlukan, menjadikannya sesuai untuk pelaksanaan tepi dan aplikasi mudah alih.

Kedua-duanya ringan dan berjalan baik pada CPU. Pocket TTS menyokong klon suara unik (Kokoro tidak). Kokoro menyokong lebih bahasa (9 vs 2). Pilih Pocket TTS jika anda memerlukan klon suara ringan, Kokoro jika anda memerlukan liputan bahasa yang lebih.

Berikan 5 saat audio rujukan. Pocket TTS mengekstrak ciri-ciri pembicara dan boleh menghasilkan percakapan baru dalam suara itu. Kualiti bertambah baik dengan rujukan yang lebih panjang (sehingga 10 saat).

Ya. Tidak seperti kebanyakan model klon yang memerlukan GPU, Pocket TTS melakukan klon suara sifar-shot sepenuhnya pada CPU kerana jejak parameter 100M kecilnya. Anda boleh klon suara dari klip pendek bahkan pada laptop atau komputer papan tunggal.

Pocket TTS dikeluarkan di bawah CC-BY-4.0, jadi anda mesti beri kredit kepada Kyutai sebagai pencipta asal bila anda menggunakan atau menyebarkan semula ia. Pengiktirafan mudah seperti "Suara dijana dengan Pocket TTS oleh Kyutai" memuaskan lesen untuk penggunaan komersial dan bukan komersial.

Pocket TTS menghasilkan percakapan pada masa nyata atau lebih cepat pada CPU piawai, tanpa GPU diperlukan. Ini menjadikannya salah satu enjin paling responsif untuk kes penggunaan latensi rendah seperti pembantu suara hidup dan penjanaan pada peranti.

Pocket TTS adalah dalam tahap harga piawai, kos 10 kredit per 1,000 aksara. Yang menjadikannya salah satu pilihan klon suara paling ekonomi yang ada pada TextToSpeechAI.

Kedua-duanya ringan, mesra CPU, enjin aras-standar. Pilih Pocket TTS apabila anda perlukan klon suara, kerana Kokoro tidak menyokongnya. Pilih Kokoro apabila anda perlukan liputan bahasa yang lebih luas dan tidak perlu klon suara tertentu.

Ya. Akaun baru TextToSpeechAI menerima kredit permulaan percuma, dan demo di tapak membolehkan anda mendengar Pocket TTS sebelum berkomitmen. Daftar secara percuma, muat naik klip rujukan pendek, dan cipta ucapan klon dalam beberapa saat.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Pocket TTS Now

Generate your first audio free. No credit card required.

Start Free