Hakkında - O.
ing the most accurate text-to-speech results. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds
Ana Özellikler
Diyalog Yaratma
Farklı seslerle ve sırayla doğal çoklu konuşmacı konuşmaları oluşturun.
Sözsüz Sesler
Doğal paralinguistik ifade için [güleyir], [inliyor], [öksürür], (nefes darlığı) ekle.
Ses Klonlama
Kişiselleştirilmiş konuşma için 5-10 saniyelik referans sesli herhangi bir ses klonla.
Doğal Konuşma
1.6B parametreleri çok doğal konuşma prosodi ve intonasyonu üretir.
Kullanım durumları
Nasıl Kullanılır - O.
-
1
Bedava kayıt olun veya demoyu açın
Başlangıç kredilerinizi talep etmek için ücretsiz bir TextToSpeechAI hesabı oluşturun veya Dia diyalogu hemen denemek için kayıt olmadan demoyu açın.
-
2
Dia motorunu seç
TTS kontrol panelinde motor listesinden Dia' yı seçin. Dia, çoklu hoparlör ve ses klonlama desteği ile diyalog odaklı, ultra- katmanlı bir modeldir.
-
3
Etiketlerle bir diyalog scripti yazın
Konuşmayı her konuşmacı turunu işaretlemek için [S1] ve [S2] kullanarak oluşturun ve doğal tepkiler istediğiniz yerlerde [laughs], [sighs], [coughs] veya (gasps) gibi sözsüz etiketler bırakın.
-
4
Ses oluştur
Dia scriptinizi GPU'larımıza göndermek için oluştur'a basın. Dia, iki konuşmacının diyaloğunu sırayla ve sözsüz etiketlerinizi tek bir ses dosyasına dönüştürür.
-
5
API'yi indirin veya çağırın
Sonuçlanan diyalogu seçtiğiniz biçimde indirin veya aynı [S1]/[S2] scriptini hesabınızdaki token ile TextToSpeechAI API'ye göndererek otomatikleştirin.
- O. API
TextToSpeechAI REST API'sini kullanarak programlı olarak konuşma oluşturun.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Merhaba, bugün nasılsın?",
"voice": "en_US-lessac-medium"
}'
Sık Sorulan Sorular
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50