Bağlan Gün
ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from
Xüsusiyyətlər
Diaqramma
Təbii çoxlu-söhbətçi söhbətlərini fərqli səslərlə və dönmə ilə yaradın.
Sözsüz səslər
[laughs], [sighs], [coughs], (gasps) əlavə edin təbii paralingvistik ifadə üçün.
Seçki
Özəl səs üçün 5-10 saniyəlik səsi klonla.
Təbii söhbət
1.6B parametrləri çox təbii söhbət prozodiya və intonasiya istehsal edir.
İstifadə halları
Necə istifadə edilməlidir Gün
-
1
Pulsuz qeyd olun ya da demo aç
Dia dialoqunu dərhal sınamaq üçün qeydiyyatsız demonu açmaq üçün ya da start kreditlərinizi tələb etmək üçün pulsuz TextToSpeechAI hesabını yaradın.
-
2
Dia motorunu seç
TTS panelində motor siyahısından Dia seçin. Dia çoxlu səsləndirici və səs klonlaşdırma dəstəyi ilə dialoq-oriented, ultra-layer modeldir.
-
3
Etiketlərlə dialoq skriptini yazın
[S1] və [S2] istifadə edərək hər bir danışan dönməsini qeyd etmək üçün söhbətinizi yazın və [laughs], [sighs], [coughs], və ya (gasps) kimi sözsüz təyinatları təbii reaksiya istədiyiniz yerə atın.
-
4
Audionu yarat
Dia skriptinizi host GPU-lara göndərmək üçün yaratma düyməsini basın. Dia iki səsli dialoqu və sizin sözsüz işarələrinizi tək bir səs faylı halında göstərəcəkdir.
-
5
API-ni yüklə və ya çağır
Tamamlanmış dialoqu seçdiyiniz formatda yüklə, ya da eyni [S1]/[S2] skriptini hesab tokeni ilə TextToSpeechAI API-yə göndərərək avtomatikləşdir.
Gün API
TextToSpeechAI REST API-ni istifadə edərək proqramlaşdırma yolu ilə danışığı yarada bilərsiniz.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Salam! Bu gün necəsiniz? [gülür] [S2] Çox yaxşıyam, soruşduğunuz üçün təşəkkür edirəm!",
"voice": "en_US-lessac-medium"
}'
Tez-tez Sorulan Sual
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50