Sessiz Ses2

Premium

Akış desteği ile Zero-shot çok dilli ses klonlama

Fast Hız
Very Good Kalite
Evet Klonlama
5 Dilleri

Hakkında Sessiz Ses2

[Translation temporarily unavailable. Please try again.]

Ana Özellikler

Zero-Shot Ses Klonlama

3-10 saniyelik referans seslerden herhangi bir sesi yüksek kalitede klonla.

Çok Dilli

Çince, İngilizce, Japonca, Korece ve Kantoncayı cross-language sentezle destekler.

Akış Desteği

Gerçek zamanlı uygulamalar ve etkileşimli sistemler için düşük gecikmeli akış modu.

Doğal Prozodi

İleri prosody modelleme, uygun intonasyon ile doğal sesli konuşma üretir.

Kullanım durumları

Çok dilli içerik yaratma Gerçek zamanlı ses asistanları Dilsel farklılıklar Kişisel ses uygulamaları

Nasıl Kullanılır Sessiz Ses2

  1. 1

    Kayıt olun ve ücretsiz kredi talep edin

    Başlangıç kredilerinizi almak için ücretsiz bir TextToSpeechAI hesabı oluşturun, ya da önce demoyu deneyin. GPU veya yerel CosyVoice2 kurulumuna gerek yok - her şey altyapımızda çalışır.

  2. 2

    CosyVoice2'yi seç ve referans klip ekle

    Motorunuz olarak CosyVoice2'yi seçin, sonra klonlamak istediğiniz sesin temiz 3-10 saniyelik referans kayıtını yükleyin. CosyVoice2, çok dilli klonlama için konuşmacının özelliklerini sıfır-atış için çıkaracaktır.

  3. 3

    Metininizi desteklenen herhangi bir dilde giriniz

    Yazılımınızı Çince, İngilizce, Japonca, Korece veya Kantonca olarak yazın veya yapıştırın. CosyVoice2 diller arası sentezi destekler, böylece klonlanmış ses referans klipten farklı bir dil konuşabilir.

  4. 4

    Konuşu oluştur

    Yapma düğmesine tıklayın ve CosyVoice2 klonlanmış ses içinde doğal, çok dilli konuşmayı sentezler, genellikle kısa metin için saniyeler içinde. Premium-level kullanımı 1000 karakter başına 25 krediye mal olur.

  5. 5

    API'yi indirin veya kullanın

    Sonuçlanan sesleri MP3 veya WAV olarak geçmişinizden indirin veya TextToSpeechAI REST API aracılığıyla CosyVoice2 ses klonlamasını ölçekli olarak otomatikleştirin.

Sessiz Ses2 API

TextToSpeechAI REST API'sini kullanarak programlı olarak konuşma oluşturun.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2, sıfır\u002Datış ses klonlama kapasitesiyle doğal çok dilli konuşma sağlar.",
    "voice": "en_US-lessac-medium"
  }'

Sık Sorulan Sorular

CosyVoice2, FunAudioLLM (Alibaba) tarafından geliştirilen yeni nesil bir metin-sözlüğe ve ses klonlama modelidir. Sadece birkaç saniyelik referans seslerden sıfır-atış ses klonlamasını destekler ve Çince, İngilizce, Japonca, Korece ve Kantonca doğal konuşmayı sentezleyebilir. TextToSpeechAI üzerinde CosyVoice2'yi yerel bir kurulum olmadan tarayıcıda çalıştırabilirsiniz.

Evet, CosyVoice2 tamamen Apache 2.0 lisansına sahiptir - hem kod hem de model ağırlıkları. Bu, ticari ürünlerde, ücretli içerikte ve lisans ücretleri veya ticari olmayan kısıtlamalar olmadan müşteri çalışmalarında güvenle kullanılmasını sağlar.

CosyVoice2 beş dil destekler: Çince (Mandarin), İngilizce, Japonca, Korece ve Kantonca. Ayrıca bir dilde kayıtlı bir ses klonlayıp başka bir dilde konuşma üretmeniz için diller arası sentezi de destekler.

Hedef hoparlör için 3-10 saniyelik temiz referans ses sağlayın. CosyVoice2, sonlu skaler kuantum yaklaşımı kullanarak hoparlör özelliklerini çıkarır, sonra da desteklediği herhangi bir dilde klonlanmış sesle yeni bir konuşma üretir. Model eğitimi veya iyileştirme gerekmez.

CosyVoice2, referans klipten farklı bir dilde konuşma oluşturulduğunda bile konuşanın kimliğini koruyan daha güçlü çok dilli klonlama modellerinden biridir. Doğal bir prosodi ve intonasyon üretir, bu da onu diller arası dublaj ve yerel içerik için uygun hale getirir.

Evet. CosyVoice2 hızlı bir modeldir ve düşük gecikmeli ses üreten bir akışı içermektedir, bu da ses asistanları ve etkileşimli uygulamalar için uygun hale getirir. TextToSpeechAI'de, kısa metinler için genellikle saniyeler içinde tamamlanan jenerasyonlar.

CosyVoice2 0.5B parametre modeli için yaklaşık 4-6GB VRAM gerektirir, bu yüzden kendi başına konumlandırıldığında 6GB veya daha fazla GPU tavsiye edilir. TextToSpeechAI üzerinde model GPU altyapımızda çalışır, bu yüzden kendi donanımınıza ihtiyacınız yoktur.

CosyVoice2, 1.000 karakterlik metin başına 25 krediye mal olan premium sınıflı bir modeldir. Her yeni hesap ücretsiz başlangıç kredisi alır, böylece ücretli bir planla karar vermeden önce CosyVoice2 ses klonlamasını deneebilirsiniz.

Her ikisi de premium ses klonlama motorlarıdır. GPT-SoVITS genellikle tek bir hedef ses için en yüksek ham benzerlik seviyesine ulaşırken, CosyVoice2 çok dilli ve dillerin arası klonlama için daha güçlüdür ve düşük gecikmeli akışı modülasyonu ekler. Birden fazla dilde konuşmak için tek bir klon ses gerektiğinde CosyVoice2'yi seçin.

Her ikisi de yüksek kaliteli sıfır-atış ses klonlama sağlar. CosyVoice2 daha fazla dil (5 karşı 2) destekler ve gerçek zamanlı kullanım için akışı ekler, F5-TTS ise sadece İngilizce çalışma yükleri için biraz daha hızlı olabilir. Çok dilli projeler için CosyVoice2 genellikle daha iyi bir uyum sağlar.

TextToSpeechAI, CosyVoice2 jenerasyonlarını MP3 ve WAV gibi yaygın formatlarda ihraç etmenize olanak tanır. Dosyayı tarih sayfanızdan doğrudan indirebilir veya TextToSpeechAI API aracılığıyla programlayarak geri alabilirsiniz.

Evet. CosyVoice2'yi ücretsiz demo ve ücretsiz başlangıç kredileriyle TextToSpeechAI'de hiçbir şey yüklemeden test edebilirsiniz. Sadece kayıt olun, kısa bir referans klip yükleyin, desteklenen herhangi bir dilde metninizi yazın ve oluşturun.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try Sessiz Ses2 Now

Generate your first audio free. No credit card required.

Start Free