OpenVoice

Ultra

Klon Suara Segera dengan Kawalan Ton Granular

Moderate Kelajuan
Very Good Kualiti
Ya Klon
10 Bahasa

Tentang OpenVoice

of the voice and apply it to the voice. OpenVoice is a powerful voice clone model that allows you to clone voices from a

Ciri-ciri Utama

Klon Segera

Klon sebarang suara dari hanya beberapa saat audio.

Kawalan Ton

Gunakan nada gembira, sedih, marah, gembira, atau berbisik.

Pemindahan Gaya

Pemisahkan identiti suara dari gaya bercakap untuk fleksibiliti.

Cross-Lingual

Guna suara klon dalam bahasa yang berbeza.

Pemprosesan Cepat

Kesimpulan yang berkesan untuk penjanaan suara yang pantas.

Sumber Terbuka

MIT dilesenkan untuk aplikasi komersial.

Gunakan Kes

Kandungan Emosional Animasi Aksara Permainan Interaktif Narrasi Buku Audio Video Pemasaran Pembantu Maya

Bagaimana untuk Guna OpenVoice

  1. 1

    Daftar secara percuma atau cuba demo

    Cipta akaun TextToSpeechAI percuma untuk mendapatkan kredit permulaan, atau gunakan demo pada halaman untuk mendengar OpenVoice sebelum menyerahkan. Tiada GPU setempat atau pemasangan diperlukan - semuanya berjalan pada pelayan kami.

  2. 2

    Pilih OpenVoice dan muat naik klip rujukan

    Pilih enjin OpenVoice, kemudian muat naik beberapa saat audio rujukan bersih untuk segera mengklon suara sasaran. OpenVoice menangkap identiti pembicara supaya anda boleh gunakannya semula di mana-mana teks dan nada.

  3. 3

    Masukkan teks anda

    Taip atau tampal skrip yang anda mahu diucapkan dalam suara klon. OpenVoice menyokong sekitar 10 bahasa dan penghantaran lintas-bahasa, jadi anda boleh menulis dalam bahasa yang berbeza daripada klip rujukan.

  4. 4

    Pilih gaya nada dan cipta

    Pilih salah satu daripada sembilan gaya nada OpenVoice - default, mesra, gembira, gembira, sedih, marah, ketakutan, menjerit, atau berbisik - kemudian cipta. Suara klon yang sama akan bercakap dengan penghantaran emosi itu.

  5. 5

    Muat turun atau guna API

    Muat turun audio anda sebagai MP3, WAV, atau OGG, atau automatikkan penjanaan melalui API TextToSpeechAI dengan menghantar suara klon dan gaya nada anda pada setiap permintaan.

OpenVoice API

Janakan ucapan secara program menggunakan API REST TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice boleh bercakap dalam sebarang nada \u002D gembira, sedih, atau bahkan berbisik.",
    "voice": "en_US-lessac-medium"
  }'

Soalan Lazim

OpenVoice adalah model klon teks-ke-tutur dan suara yang canggih yang memisahkan identiti suara dari gaya bercakap. Ini membolehkan anda klon suara dan kemudian gunakan nada emosi yang berbeza tanpa memerlukan audio rujukan baru untuk setiap emosi. Ia dibina untuk penjanaan ucapan yang ekspresif dan boleh dikawal.

Ya, OpenVoice melakukan klon suara segera dari hanya beberapa saat audio rujukan - tiada latihan berjalan diperlukan. Sebaik sahaja suara ditangkap, OpenVoice boleh guna semula identiti itu di mana-mana teks dan mana-mana gaya nada yang anda pilih.

OpenVoice menggunakan rekabentuk dua peringkat yang memisahkan sintesis percakapan asas dari penukaran nada. Selepas mengklon suara, anda boleh gunakan mana-mana daripada 9 gaya nada - default, mesra, gembira, gembira, sedih, marah, ketakutan, menjerit, atau berbisik - dan suara yang sama yang diklon bercakap berbeza berdasarkan nada yang anda pilih tanpa merakam semula.

OpenVoice menyokong sembilan gaya bercakap: piawai, mesra, gembira, gembira, sedih, marah, terkejut, menjerit, dan berbisik. Setiap gaya mencipta semula penghantaran emosi sambil memelihara identiti pembicara klon, memberikan anda kawalan berkadaran halus tentang bagaimana baris dibaca.

OpenVoice adalah sumber terbuka di bawah lesen MIT yang membenarkan, jadi ia adalah percuma untuk penggunaan komersial. Seperti mana-mana model klon, pastikan anda mempunyai hak yang betul untuk sebarang suara yang anda klon untuk projek komersial.

OpenVoice menyokong sekitar 10 bahasa termasuklah Bahasa Inggeris, Cina, Jepun, Korea, dan beberapa bahasa Eropah. Ia juga menawarkan klon lintas-bahasa, jadi anda boleh klon suara dalam satu bahasa dan buat ia bercakap secara semulajadi dalam bahasa lain.

OpenVoice mempunyai kelajuan penjanaan sederhana, biasanya mengekspresikan ayat dalam 2-4 saat pada GPU. Kualiti output sangat baik, dengan reproduksi suara yang jelas dan pemindahan nada yang menjaga identiti pembicara tidak berubah semasa mengubah penghantaran emosi dengan meyakinkan.

OpenVoice biasanya memerlukan 6-8GB VRAM bergantung pada saiz bakul dan beban penukaran nada. Ia berjalan dengan selesa pada GPU jarak tengah ke jarak tengah atas, dan pada TextToSpeechAI semua ini ditangani pada pelayan kami jadi anda tidak perlukan sebarang perkakasan setempat.

OpenVoice adalah enjin Ultra-tahap, bernilai 50 kredit per 1000 aksara. Tahap Ultra mencerminkan kawalan nada yang lebih maju dan pengiraan tambahan yang diperlukan untuk klon plus paip penukaran gaya.

OpenVoice unik untuk kawalan nada dan gayanya: anda boleh ambil satu suara klon dan hantar semula sebagai gembira, sedih, marah, atau berbisik. F5-TTS lebih pantas dan adalah enjin klon default kami untuk ucapan semulajadi, neutral. Pilih OpenVoice apabila anda perlukan kawalan gaya emosi, dan F5-TTS apabila anda mahu klon semulajadi terpantas.

Cipta suara klon dengan memuat naik audio rujukan, kemudian nyatakan gaya nada dalam permintaan API anda. API akan melaksanakan nada emosi yang dipilih kepada suara klon secara automatik dan mengembalikan audio dalam format MP3, WAV, atau OGG.

Ya. Daftar untuk akaun TextToSpeechAI percuma untuk menerima kredit permulaan dan cuba klon OpenVoice dan kawalan nada, atau gunakan demo pada halaman pertama. Tiada seting setempat - muat naik klip rujukan, pilih nada, dan cipta dalam pelayar.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free