OpenVoice

Ultra

Penuturan Suara Instan dengan Kontrol Granular Tone

Moderate Kecepatan
Very Good Kualitas
Ya Kloning
10 Bahasa

Tentang OpenVoice

OpenVoice adalah model kloning suara yang serbaguna yang memungkinkan kendali halus atas gaya berbicara. Tidak seperti model kloning lain, OpenVoice memisahkan identitas suara dari gaya berbicara, memungkinkan Anda untuk mengambil suara kloning dan menerapkan nada berbeda - ceria, sedih, marah, bersemangat, atau berbisik - tanpa audio referensi baru.

Fitur Kunci

Kloning Instan

Kloning suara apapun dari hanya beberapa detik audio.

Kontrol Nada

Terapkan nada ceria, sedih, marah, bersemangat, atau berbisik.

Transfer Gaya

Pisahkan identitas suara dari gaya berbicara untuk fleksibilitas.

Cross-Lingual

Gunakan suara kloning di berbagai bahasa.

Pengolahan Cepat

Efisien inferensi untuk generasi suara cepat.

Sumber Terbuka

MIT lisensi untuk aplikasi komersial.

Gunakan Kasus

Isi Emosi Animasi Karakter Permainan Interaktif Narasi Audio Video Pemasaran Asisten Virtual

Cara Menggunakan OpenVoice

  1. 1

    Daftar bebas atau coba demo

    Create a free TextToSpeechAI account to get starter credits, or use the on-page demo to hear OpenVoice before committing. No local GPU or install is needed - everything runs on our servers.

  2. 2

    Pilih OpenVoice dan upload sebuah klip referensi

    Pilih mesin OpenVoice, lalu upload beberapa detik audio referensi bersih untuk mengklon suara target secara langsung. OpenVoice menangkap identitas pembicara sehingga Anda dapat menggunakannya kembali di seluruh teks dan nada.

  3. 3

    Masukkan teks Anda

    Ketik atau tempelkan skrip yang ingin Anda gunakan dalam suara hasil kloning. OpenVoice mendukung sekitar 10 bahasa dan pengiriman lintas bahasa, sehingga Anda dapat menulis dalam bahasa yang berbeda dari klip referensi.

  4. 4

    Pilih gaya nada dan hasilkan

    Pilih salah satu dari sembilan gaya nada OpenVoice - default, ramah, ceria, gembira, sedih, marah, takut, berteriak, atau berbisik - lalu menghasilkan suara tiruan yang sama akan berbicara dengan pengiriman emosional.

  5. 5

    Unduh atau gunakan API

    Download your audio as MP3, WAV, or OGG, or automate generation through the TextToSpeechAI API by passing your cloned voice and tone style in each request.

OpenVoice API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice dapat berbicara dengan nada apa pun \u002D ceria, sedih, atau bahkan berbisik.",
    "voice": "en_US-lessac-medium"
  }'

Pertanyaan yang Sering Diajukan

OpenVoice adalah model yang canggih dalam bahasa teks ke bahasa dan suara yang mengkloning suara yang secara unik memisahkan identitas suara dari gaya bicara. Hal ini memungkinkan Anda mengklon sebuah suara dan kemudian menerapkan nada emosional yang berbeda tanpa membutuhkan audio referensi baru untuk setiap emosi. Hal ini dibangun untuk ekspresif, generasi pidato yang terkendali.

Ya, OpenVoice melakukan kloning suara instan dari beberapa detik saja dari audio referensi - tidak diperlukan pelatihan. Setelah suara ditangkap, OpenVoice dapat menggunakan ulang identitas itu di seluruh teks dan gaya nada apapun yang Anda pilih.

OpenVoice menggunakan arsitektur dua tahap yang memisahkan sintesis dari konversi nada. Setelah mengklon sebuah suara, Anda dapat menerapkan salah satu dari 9 gaya nada - baku, ramah, ceria, bersemangat, sedih, marah, takut, berteriak, atau berbisik-bisik - dan suara kloning yang sama berbicara berbeda berdasarkan nada pilihan Anda tanpa recording.

OpenVoice mendukung sembilan gaya bicara: baku, ramah, ceria, gembira, sedih, marah, takut, dan berbisik. setiap gaya membentuk kembali pengiriman emosional saat melestarikan identitas speaker kloning, memberikan Anda kendali yang bagus tentang bagaimana baris dibaca.

OpenVoice adalah sumber-terbuka di bawah lisensi MIT perresensi, sehingga bebas untuk penggunaan komersial. Seperti model kloning apapun, pastikan Anda memiliki hak yang tepat untuk suara yang Anda kloning untuk proyek komersial.

OpenVoice mendukung sekitar 10 bahasa termasuk bahasa Inggris, Cina, Jepang, Korea, dan beberapa bahasa Eropa. sehingga Anda dapat mengklon sebuah suara dalam satu bahasa dan membuatnya berbicara secara alami dalam bahasa lain.

OpenVoice memiliki kecepatan moderat dari generasi, biasanya memberikan kalimat dalam 2-4 detik pada kualitas GPU. Kualitas keluaran sangat baik, dengan reproduksi suara yang jelas dan transfer nada yang membuat identitas pembicara tetap utuh ketika meyakinkan mengubah pengiriman emosi.

OpenVoice typically requires 6-8GB of VRAM depending on batch size and tone conversion load. It runs comfortably on mid-range to upper mid-range GPUs, and on TextToSpeechAI all of this is handled on our servers so you do not need any local hardware.

OpenVoice adalah mesin Ultra-tier, harganya 50 kredit per 1000 karakter.

OpenVoice unik untuk nada dan kontrol gayanya: Anda dapat mengambil satu suara kloning dan mengirimkannya kembali sebagai ceria, sedih, marah, atau berbisik. F5-TTS lebih cepat dan mesin kloning utama kita untuk berbicara natural, netral. Pilih OpenVoice ketika Anda membutuhkan kontrol gaya emosional, dan F5-TTS ketika Anda ingin klon alami tercepat.

Buat suara tiruan dengan mengunggah audio referensi, lalu nyatakan gaya nada pada permintaan API Anda. API menerapkan nada emosi Anda ke suara kloning secara otomatis dan mengembalikan audio MP3, WAV, atau format OGG.

Yes. Sign up for a free TextToSpeechAI account to receive starter credits and try OpenVoice cloning and tone control, or use the on-page demo first. There is no local setup - upload a reference clip, pick a tone, and generate in the browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free