OpenVoice

Ultra

Granüler Tonu Kontrolü ile Anında Ses Klonlama

Moderate Hız
Very Good Kalite
Evet Klonlama
10 Dilleri

Hakkında OpenVoice

of the voice and apply different tones - cheerful, sad, angry, excited, or whispering - without new reference audio. OpenVoice is a versatile instant voice cloning model that allows fine-grained control over speaking style, allowing you to take a look at the voice and apply different tones - cheerful, sad, angry, excited, or whispering - without new reference audio.

Ana Özellikler

Anında Klonlama

Sadece birkaç saniyelik sesten herhangi bir ses klonlayabilirsiniz.

Tonu Kontrol Et

Neşeli, üzgün, kızgın, heyecanlı veya fısıldayan tonlar uygulayın.

Stil Transferi

Ses kimliğini esneklik için konuşma tarzından ayırın.

Cross-Lingual

Farklı dillerde klonlanmış sesleri kullanın.

Hızlı İşlem

Hızlı ses üretimi için verimli çıkarım.

Açık kaynak

MIT lisanslı ticari uygulamalar için.

Kullanım durumları

Duygusal İçerik Karakter Animasyonu Etkileşimli Oyunlar Sesli Kitap Anlatımı Pazarlama Videoları Sanal Yardımcılar

Nasıl Kullanılır OpenVoice

  1. 1

    Ücretsiz kayıt olun veya demoyu deneyin

    Başlangıç kredileri almak için ücretsiz bir TextToSpeechAI hesabı oluşturun, ya da sitedeki demoyu kullanarak OpenVoice'ı yüklemeden önce dinleyin. Yerel GPU veya yükleme gerekmez - her şey sunucularımızda çalışır.

  2. 2

    OpenVoice'ı seç ve referans klip yükle

    OpenVoice motorunu seçin, sonra hedef sesin hemen klonlanması için birkaç saniyelik temiz referans ses yükleyin. OpenVoice konuşmacının kimliğini yakalayarak onu herhangi bir metin ve ton üzerinde tekrar kullanabilirsiniz.

  3. 3

    Metininizi girin

    Klonlanmış sesle söylenmesini istediğiniz yazıyı yazın veya yapıştırın. OpenVoice yaklaşık 10 dil ve diller arası aktarımı destekler, bu yüzden referans klipten farklı bir dilde yazabilirsiniz.

  4. 4

    Bir ton stili seç ve oluştur

    Dokuz OpenVoice ton stilinden birini seçin - varsayılan, dostça, neşeli, heyecanlı, üzgün, kızgın, korkunç, bağıran veya fısıldayan - sonra oluşturun. Aynı klon ses bu duygusal teslimatla konuşacak.

  5. 5

    API'yi indirin veya kullanın

    Sesinizi MP3, WAV veya OGG olarak indir, veya her isteğe klonlanmış ses ve ton tarzını göndererek TextToSpeechAI API üzerinden otomatik üretim yap.

OpenVoice API

TextToSpeechAI REST API'sini kullanarak programlı olarak konuşma oluşturun.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice herhangi bir tonla konuşabilir \u002D neşeli, üzgün veya hatta fısıldayan.",
    "voice": "en_US-lessac-medium"
  }'

Sık Sorulan Sorular

OpenVoice, ses kimliğini konuşma tarzından eşsiz bir şekilde ayıran gelişmiş bir metin-sözlüğe ve ses klonlama modelidir. Bu, bir sesi klonlamanıza ve sonra her duygu için yeni referans ses gerektirmeden farklı duygusal tonlar uygulamanıza olanak tanır. İfadesel, kontrol edilebilir konuşma üretimi için inşa edilmiştir.

Evet, OpenVoice sadece birkaç saniyelik referans seslerden anlık ses klonlama yapıyor - eğitim gerekmiyor. Bir ses kaydedildiğinde, OpenVoice bu kimliği seçtiğiniz herhangi bir metin ve herhangi bir ton stilinde tekrar kullanabilir.

OpenVoice temel konuşma sentezini ton dönüşümünden ayıran iki aşamalı bir mimari kullanır. Bir sesi klonladıktan sonra, 9 ton stilinden herhangi birini uygulayabilirsiniz - varsayılan, dostça, neşeli, heyecanlı, üzgün, kızgın, korkunç, bağırıyor veya fısıldıyor - ve aynı klonlanmış ses yeniden kaydetmeden seçtiğiniz tonun üzerine dayanarak farklı konuşur.

OpenVoice dokuz konuşma tarzı destekler: varsayılan, dostça, neşeli, heyecanlı, üzgün, kızgın, korkunç, bağırıp çağıran ve fısıldayan. Her bir tarz, bir satır okunması üzerinde size ince taneli kontrol sağlayarak, klonlanmış konuşmacı kimliğini korurken duygusal teslimatı yeniden şekillendirir.

OpenVoice, MIT lisansı altında açık kaynaktır, bu yüzden ticari kullanım için ücretsizdir. Herhangi bir klonlama modeli gibi, ticari projeler için klonladığınız herhangi bir sesin uygun haklarınıza sahip olduğunuzdan emin olun.

OpenVoice İngilizce, Çince, Japonca, Korece ve birkaç Avrupa dili dahil olmak üzere yaklaşık 10 dil destekler. Ayrıca bir dilde bir ses klonlayabileceğiniz ve diğer bir dilde doğal bir şekilde konuşabileceğiniz dillerarası klonlama da sunar.

OpenVoice ortalama üretim hızına sahiptir, genellikle bir cümleyi GPU üzerinde 2-4 saniye içinde göstermektedir. Çıkış kalitesi, konuşmacının kimliğini sağlam tutarak duygusal teslimatı ikna edici bir şekilde değiştiren net ses yeniden üretimi ve ton aktarımı ile çok iyidir.

OpenVoice genellikle parti büyüklüğüne ve ton dönüşüm yüküne bağlı olarak 6-8GB VRAM gerektirir. Orta ve üst orta seviye GPU' larda rahatça çalışır ve TextToSpeechAI' de tüm bunlar sunucularımızda işlenir, böylece herhangi bir yerel donanıma ihtiyacınız yoktur.

OpenVoice, 1000 karakter başına 50 krediye mal olan Ultra-tier motorudur. Ultra-tier, gelişmiş ton kontrolünü ve klonlama ve stil-dönüşüm boru hattına ihtiyaç duyulan ekstra hesaplamayı yansıtır.

OpenVoice, ton ve tarz kontrolü açısından eşsizdir: klonlanmış bir sesi alıp onu neşeli, üzgün, kızgın veya fısıltılı olarak yeniden gönderebilirsiniz. F5- TTS daha hızlıdır ve doğal, tarafsız konuşma için varsayılan klonlama motorumuzdur. Duygusal tarz kontrolüne ihtiyacınız olduğunda OpenVoice' i, en hızlı doğal klon istediğinizde F5- TTS' i seçin.

Referans ses yükleyerek klonlanmış bir ses oluşturun, sonra API talebinizde bir ton stili belirtin. API seçilen duygusal tonu klonlanmış seste otomatik olarak uygular ve sesi MP3, WAV veya OGG biçiminde geri verir.

Evet. Başlangıç kredileri almak ve OpenVoice klonlama ve ton kontrolünü denemek için ücretsiz bir TextToSpeechAI hesabına kayıt olun, ya da önce sayfadaki demoyu kullanın. Yerel bir ayarlama yok - referans klip yükleyin, ton seçin ve tarayıcıda oluşturun.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free