Kotak Obrolan

Premium

Nol-shot kloning suara dengan pidato ekspresif dalam 23 bahasa

Fast Kecepatan
Very Good Kualitas
Ya Kloning
23 Bahasa

Tentang Kotak Obrolan

Chatterbox adalah model kloning suara yang kuat TTS dari Resemble AI. Ini melakukan kloning suara nol-shot hanya dari beberapa detik referensi audio, mendukung 23 bahasa dengan ekspresi alami. Chatterbox termasuk tag paralinguistik untuk menambahkan suara alami seperti tawa dan batuk untuk menghasilkan pidato.

Fitur Kunci

Cloning Suara Suara Suara-nol-Shot

Menduplikasikan suara apapun dari beberapa detik audio - tidak ada pelatihan yang diperlukan.

23 Bahasa

Dari Arab ke Cina, mencakup kebanyakan bahasa dunia.

Tag Ekskriptif

Tambahkan [Tertawa], [batuk], [chuckle] untuk suara paralinguistik alami.

Inferensi Cepat

Latensi sub 200m dengan varian Turbo untuk aplikasi real-time.

Gunakan Kasus

Kloning suara untuk pembuatan konten Aplikasi suara multibahasa Desain suara karakter untuk permainan Asisten suara pribadi

Cara Menggunakan Kotak Obrolan

  1. 1

    Mendaftar atau membuka demo

    Create a free TextToSpeechAI account to claim 200 starter credits, or use the on-page demo to try Chatterbox without signing in.

  2. 2

    Pilih Chatterbox dan tambahkan klip referensi

    Pilih mesin Chatterbox, lalu upload pendek (beberapa detik) klip audio dari suara yang ingin Anda clone. Chatterbox klon nol-shot secara langsung - tidak dibutuhkan pelatihan.

  3. 3

    Masukkan teks Anda dengan tag opsional

    Ketik atau tempelkan teks untuk berbicara dalam 23 bahasa yang didukung, dan jatuhkanlah [laugh], [batuk], atau [chuckle] tag di mana pun Anda ingin suara paralinguistik alami.

  4. 4

    Hasilkan pidato

    Click generate and TextToSpeechAI renders your text in the cloned Chatterbox voice on hosted GPU infrastructure, spending 25 credits per 1,000 characters.

  5. 5

    Unduh atau gunakan API

    Download the finished audio file, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com using your account token.

Kotak Obrolan API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kotak obrolan dapat mengkloning suara Anda hanya dari beberapa detik audio dan berbicara dalam 23 bahasa.",
    "voice": "en_US-lessac-medium"
  }'

Pertanyaan yang Sering Diajukan

Kotak obrolan adalah sebuah model kloning teks-ke-peech dengan jarak nol dari Resemble AI. Ini dapat mereplikasikan suara apapun dari hanya beberapa detik dari audio referensi dan menghasilkan pidato alami ekspresif dalam 23 bahasa, semua tanpa pelatihan per-voice.

Ya, Chatterbox sepenuhnya dilisensikan MIT - baik kode maupun berat model - sehingga Anda dapat menggunakannya secara bebas dalam produk komersial. audio yang dihasilkan termasuk sebuah tanda saraf opsional yang dapat dinonaktifkan, dan tidak ada penggunaan royalti.

Anda menyediakan klip referensi pendek dari suara apapun (beberapa detik saja sudah cukup) dan Chatterbox mengekstrak timbre dan gaya suara itu menjadi embedding speaker. Ini kemudian menghasilkan pidato baru dalam suara yang tanpa langkah baik atau latihan, yang artinya "nol-shot" berarti.

Chatterbox membaca tag inline khusus dalam teks Anda untuk menambahkan alami suara non-verbal: [laugh] memasukkan tawa, [batuk] memasukkan batuk, dan [chuckle] memasukkan tertawa lembut.

Ketik tag langsung di dalam teks masukan Anda di tempat di mana suara seharusnya terjadi, dikelilingi oleh sisa kalimat Anda. Chatterbox menerjemahkan suara paralinguistik dalam suara kloning, mencampurnya ke pidato sekitarnya sehingga terdengar spontan daripada disejajarkan.

Chatterbox mendukung 23 bahasa, termasuk bahasa Arab, Denmark, Jerman, Inggris, Spanyol, Finlandia, Prancis, Ibrani, Hindi, Italia, Jepang, Malay, Belanda, Norwegia, Portugis, Portugis, Rusia, Swahili, Turki, dan Cina.

Chatterbox menghasilkan pidato dengan cepat di GPU, dan varian Turbo mencapai latensi sub-200ms untuk penggunaan percakapan real-time. kualitas sangat baik, dengan prosody alami dan reproduksi suara yang setia dari bahkan klip referensi pendek.

Chatterbox needs roughly 4-8GB of VRAM depending on the variant, with the Turbo model running comfortably in about 4GB. On TextToSpeechAI you do not need any local GPU - generation runs on our hosted infrastructure.

Chatterbox adalah mesin premium-tier yang menghabiskan 25 kredit per 1.000 karakter. akun baru mendapatkan 200 kredit gratis untuk mencoba kloning suara, dan Anda hanya menghabiskan kredit pada teks yang Anda benar-benar menghasilkan.

Kedua dukungan kloning suara nol-shot, tapi Chatterbox mencakup lebih banyak bahasa (23 vs 2) dan menambahkan paralinguistik ekspresif tag. F5-TTS dapat tepikan prosody Inggris sedikit lebih alami, sehingga memilih Chatterbox untuk kloning multilingual dan suara ekspresif, dan F5-TTS untuk kesetiaan hanya Bahasa Inggris.

Keduanya menawarkan kloning suara berkualitas tinggi. Chatterbox mendukung 23 bahasa dan tanda ekspresif inline, sementara OpenVoice menambahkan kontrol gaya suara (ramah, sedih, marah, dan lebih) bahwa Chatterbox kekurangan. Pilih Chatterbox untuk cakupan bahasa luas dan OpenVoice ketika Anda membutuhkan eksplisit nada emosional styling.

Yes. Sign up for a free TextToSpeechAI account to receive 200 starter credits, or use the on-page demo to hear Chatterbox without signing in. Upload a short reference clip, type your text, and generate a cloned voice in seconds.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Kotak Obrolan Now

Generate your first audio free. No credit card required.

Start Free