GPT-Sovyetler
PremiumEn yüksek kaliteli çıkışı ile birkaç vuruşlu ses klonlama
Hakkında GPT-Sovyetler
ing. It is a
Ana Özellikler
Ses klonlama
En iyi kalite için bir transkrip ile 3-10 saniyelik referans sesli herhangi bir ses klonla.
Cross-Lingual Synthesis
Bir dilde eğitim ve Çince, İngilizce, Japonca, Korece veya Kantonca konuşma oluşturun.
En Yüksek Kalite
GPT-SoVITS sürekli olarak mevcut en yüksek kaliteli ses klonlama modelleri arasında yer alır.
Açık kaynak
Aktif toplum geliştirme ve geniş belgelendirme ile tamamen MIT lisanslı.
Kullanım durumları
Nasıl Kullanılır GPT-Sovyetler
-
1
Bedava bir hesap oluşturun veya demoyu açın
TextToSpeechAI için ücretsiz başlangıç kredileri almak için kayıt olun veya GPT-SoVITS'i kayıt gerektirmeden denemek için demo'ya doğrudan atlayın.
-
2
GPT-SoVITS'i seç ve referans klip yükle
Motorunuz olarak GPT-SoVITS'i seçin, sonra klonlamak istediğiniz sesin 3-10 saniyelik referans klipini yükleyin. Bu klipin transkriptini eklemek en temiz, en doğru klonlamaya yol açar.
-
3
Metininizi girin
Klonlanmış sesle söylenmesini istediğiniz metni yazın veya yapıştırın. GPT-SoVITS Çince, İngilizce, Japonca, Korece ve Kantoncayı destekler, diğer bir dilde referanstan diller arası klonlama da dahil.
-
4
Ses oluştur
İşi GPU sunucularımıza göndermek için oluştur'a tıklayın. GPT-SoVITS orta hızda mükemmel kalitede klonlanmış konuşmayı 1000 karakter başına 25 kredi ile sunuyor.
-
5
API'yi indirin veya kullanın
Bittiğinde GPT-SoVITS sesinizi dosya olarak indirin veya üretim çalışma akışları için api.texttospeechai.com'daki TextToSpeechAI REST API'den otomatik üretim yapabilirsiniz.
GPT-Sovyetler API
TextToSpeechAI REST API'sini kullanarak programlı olarak konuşma oluşturun.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS, sadece birkaç saniye sesten en yüksek kaliteli ses klonlama üretir.",
"voice": "en_US-lessac-medium"
}'
Sık Sorulan Sorular
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25