Konuşmak

Premium

23 dilde ifade edici konuşmayla sıfır-atış ses klonlama

Fast Hız
Very Good Kalite
Evet Klonlama
23 Dilleri

Hakkında Konuşmak

[Translation temporarily unavailable. Please try again.]

Ana Özellikler

Zero-Shot Ses Klonlama

Birkaç saniyelik sesten herhangi bir ses klonlayın - eğitim gerekmez.

23 dil

Arapça'dan Çince'ye, dünyanın en büyük dillerini kapsar.

İfadeli Etiketler

Doğal paralinguistik sesler için [gülüyor], [öksürüyor], [çığlıyor] ekle.

Hızlı Sonuç

Turbo varyantıyla gerçek zamanlı uygulamalar için 200ms'in altında gecikme.

Kullanım durumları

İçerik oluşturmak için ses klonlama Çok dilli ses uygulamalarıName Oyunlar için karakter ses tasarımı Kişisel ses asistanları

Nasıl Kullanılır Konuşmak

  1. 1

    Kayıt ol veya demoyu aç

    200 başlangıç kredisi talep etmek için ücretsiz bir TextToSpeechAI hesabı oluşturun veya Chatterbox'u giriş yapmadan denemek için sayfadaki demoyu kullanın.

  2. 2

    Konuşma kutusunu seç ve referans klip ekle

    Chatterbox motorunu seçin, sonra klonlamak istediğiniz sesin kısa (birkaç saniye) ses klipini yükleyin. Chatterbox zero-shot onu anında klonlar - eğitim gerekmez.

  3. 3

    Metininizi seçmeli etiketlerle giriniz

    Desteklenen 23 dilden herhangi birinde konuşmak için metni yazın veya yapıştırın ve doğal paralingvistik sesleri istediğiniz her yerde [laugh], [cough] veya [chuckle] etiketlerini bırakın.

  4. 4

    Konuşu oluştur

    Üreteceğe tıklayın ve TextToSpeechAI metininizi klonlanmış Chatterbox sesi üzerinde GPU altyapısında, 1000 karakter başına 25 kredi harcayarak gösterir.

  5. 5

    API'yi indirin veya kullanın

    Bittiğinde ses dosyasını indirin veya api.texttospeechai.com'daki TextToSpeechAI REST API'si aracılığıyla hesap tokeninizi kullanarak otomatik üretim yapın.

Konuşmak API

TextToSpeechAI REST API'sini kullanarak programlı olarak konuşma oluşturun.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Chatterbox sadece birkaç saniyelik sesten sesini klonlayabilir ve 23 dilde konuşabilir.",
    "voice": "en_US-lessac-medium"
  }'

Sık Sorulan Sorular

Chatterbox, Resemble AI'den sıfır-atış ses klonlama metin-söz-e-söz modelidir. Sadece birkaç saniyelik referans ses ile herhangi bir sesi kopyalayabilir ve 23 dilde doğal, ifade edici bir konuşma oluşturabilir, hepsi de herhangi bir ses eğitimi olmadan.

Evet, Chatterbox hem kod hem de model ağırlıkları açısından MIT lisansına sahiptir. Bu yüzden ticari ürünlerde serbestçe kullanabilirsiniz. Üretilmiş ses, etkisiz hale getirilebilecek bir nöral su işareti içerir ve kullanım hakkı yoktur.

Herhangi bir sesin kısa bir referans klipini sağlarsınız (birkaç saniye yeterlidir) ve Chatterbox bu sesin timbre ve stilini bir konuşmacı entegresine çıkarır. Sonra bu sesle hiçbir düzenleme veya eğitim adımıyla yeni bir konuşma üretir, bu da "sıfır-atış" anlamına gelir.

Chatterbox, metininizde doğal sözel olmayan sesler eklemek için özel etiketler okur: [laugh] gülmeyi, [cough] öksürmeyi ve [chuckle] yumuşak gülmeyi ekler. Sadece sesin istediğiniz yere bir etiket koyunuz, örneğin "Bu komik [laugh] ama ciddi...".

Etiketi, cümlenin geri kalanıyla çevrili olarak, sesin meydana geldiği yerde, girdi metninizin içerisine doğrudan yazın. Chatterbox, klonlanmış sesteki paralingvistik sesi, çevredeki konuşmayla karıştırarak, böylece ses, birbirine bağlanmış olmak yerine spontan olarak duyulacaktır.

Chatterbox, Arapça, Danimarkaca, Almanca, Yunanca, İngilizce, İspanyolca, Fince, Fransızca, İbranice, Hintçe, İtalyanca, Japonca, Korece, Malay, Hollanda, Norveççe, Polonyaca, Portekizce, Rusça, İsveççe, Swahili, Türkçe ve Çince dahil olmak üzere 23 dil destekler.

Chatterbox, GPU üzerinde hızlı bir şekilde konuşma üretir ve Turbo varyantı gerçek zamanlı konuşma kullanımı için 200ms'in altında gecikmeye ulaşır. Kalite, kısa referans kliplerinden bile doğal prozodi ve sadık ses yeniden üretimi ile çok iyidir.

Chatterbox, Turbo modelinin yaklaşık 4GB' da rahatça çalışmasıyla, varyantına bağlı olarak yaklaşık 4- 8GB VRAM gerektirir. TextToSpeechAI' de herhangi bir yerel GPU' ya ihtiyacınız yoktur - jenerasyon bizim ev sahipliği yaptığımız altyapıda çalışır.

Chatterbox, 1000 karakter başına 25 krediye mal olan bir premium motor. Yeni hesaplar ses klonlama denemek için 200 kredi alır ve kredileri sadece gerçekten oluşturduğunuz metin için harcarsınız.

Her ikisi de sıfır-atış ses klonlamasını destekler, ancak Chatterbox çok daha fazla dil kapsar (23 vs 2) ve ifade edici paralinguistik etiketler ekler. F5-TTS biraz daha doğal İngilizce prosodiyi sınırlayabilir, bu yüzden çok dilli klonlama ve ifade edici sesler için Chatterbox'u ve sadece İngilizce'ye bağlılık için F5-TTS'yi seçin.

Her ikisi de yüksek kaliteli ses klonlama sağlar. Chatterbox 23 dil ve satır içinde ifade etiketlerini desteklerken, OpenVoice Chatterbox'un eksik olduğu ton stil kontrollerini (dost, üzgün, kızgın ve daha fazlası) ekler. Geniş dil kapsamı için Chatterbox'u ve açık duygusal ton stiline ihtiyacınız olduğunda OpenVoice'ı seçin.

Evet. 200 başlangıç kredisi almak için ücretsiz bir TextToSpeechAI hesabına kayıt olun, ya da Chatterbox'u giriş yapmadan dinlemek için sayfadaki demoyu kullanın. Kısa bir referans klip yükleyin, metninizi yazın ve saniyeler içinde klonlanmış bir ses oluşturun.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Konuşmak Now

Generate your first audio free. No credit card required.

Start Free