дија
UltraДиалогски оријентисани ТТС са клонирањем гласа и невербалним звуковима
О дија
Дија од Нари Лабса је модел у дијалогу 1, 6Б. Изврсно ствара природни разговор са подршком за невербалне звуке као смех, уздахне и кашаљ. Дија подржава генерацију вишезвучног дијалога и клонирање гласа из 5- 10 секунди референтног звука, што га чини идеалним за стварање реалистичне разговоре и знаковних гласова.
Могућности кључа
Генерисање дијалога
Генерише природне мулти-звучник разговора са различитим гласовима и преокретање.
Невербални звукови
Додај [смех], [уздише], [кашаљ], (гаспс) за природни паралингвистички израз.
Гласово клонирање
Клонирајте сваки глас из 5-10 секунди референтног звука за персонализовани говор.
Природни разговор
1.6Б параметри произвођају веома природну разговорну прозију и интонацију.
Случаји коришћења
Како користити дија
-
1
Упиши се слободно или отвори демо
Направите бесплатни TextToSpeechAI налог да тражите стартер кредите, или отворите демо да одмах покушате са Диа дијалогом.
-
2
Изаберите дија мотор
У ТТС таблој бирате Дија са списка мотора. Дија је дијалог- оријентисан, ултра- тијер модел са вишезговочничким и глас- клонирајућим подршком.
-
3
Упиши дијалог скрипту са ознакама
Саставите разговор користећи [С1] и [С2] да обележава сваки говорник окрета, и падне у невербалне ознаке као што су [смех], [уздише], [кашаљ], или (гасп где желите природне реакције.
-
4
Генериши аудио
Кликните да бисте пошаљели дија скрипту ГПУ‐ у. Дија приказује двозвучни дијалог са пребацивањем и вашим невербалним ознакама у један аудио фајл.
-
5
Преузми или позови АПИ
Преузми завршени дијалог у изабраном формату, или аутоматски га постављајући исту скрипту [S1]/[S2] на TextToSpeechAI АПИ са жетоном вашег налога.
дија АПИ
Генерише програмски говор користећи TextToSpeechAI РЕСТ АПИ.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Здраво, како си данас?",
"voice": "en_US-lessac-medium"
}'
често постављана питања
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50