TTS 2 tarzı
Ultraİnsan seviyesindeki metin- konuşmaya biçim aktarımıName
Hakkında TTS 2 tarzı
s. StyleTTS 2 is a
Ana Özellikler
İnsan seviyesi kalitesi
Kör testlerde insan kayıtlarından ayırt edilemeyen bir konuşma üretir.
Stil Transferi
Herhangi bir referans ses örneğinden konuşma tarzını aktarın.
Doğal Prozodi
Mükemmel ritim, stres ve intonasyon yayılma-tabanlı modelleme ile.
Ses Klonlama
Olağanüstü doğruluk ve doğallıkla sesleri klonla.
Hızlı Sonuç
Kaliteyi korurken oto-regresif modellerden daha hızlı.
Açık kaynak
MIT lisansı ile tam ticari kullanım hakları.
Kullanım durumları
TTS 2 tarzı Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENNasıl Kullanılır TTS 2 tarzı
-
1
Bedava kayıt olun veya demoyu çalıştırın
Başlangıç kredileri almak için ücretsiz bir TextToSpeechAI hesabı oluşturun veya StyleTTS2'yi giriş yapmadan dinlemek için ana sayfa demosunu kullanın.
-
2
StyleTTS2 motorunu seçin
Ses kütüphanesinden StyleTTS2 sesini seçin. Bir sesi klonlamak için, 10-30 saniyelik referans klip yükleyin ve StyleTTS2 onun tarzını aktaracaktır.
-
3
Metininizi girin
Konuşturulmasını istediğiniz senaryoyu yapıştırın veya yazın. StyleTTS2 İngilizcede üstündür ve uzun bölümlerde doğal bir ses tonu, vurgu ve intonasyon sağlar.
-
4
Ses oluştur
Üreteceğe tıklayın ve TextToSpeechAI StyleTTS2 sesinizi GPU'da gösterecektir. Ultra-tier StyleTTS2 1000 karakter başına 50 krediye mal olur.
-
5
API'yi indirin veya kullanın
Bittiğinde StyleTTS2 ses MP3, WAV veya OGG olarak indirin veya üretimi otomatikleştirmek için StyleTTS2 sesinizle TextToSpeechAI API'yi arayınız.
TTS 2 tarzı API
TextToSpeechAI REST API'sini kullanarak programlı olarak konuşma oluşturun.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS 2 konuşmayı o kadar doğal üretir ki, profesyonel insan kayıtlarına rakip olur.",
"voice": "styletts2-default"
}'
Sık Sorulan Sorular
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50