Dia
UltraĮ dialogą orientuoti TTS su balso klonavimu ir neverbaliniais garsais
Apie Dia
Dia – tai 1,6B parametro dialogo, kuriame yra į tekstą orientuotas tekstas į garsą, modelis. Tai puikiai tinka generuoti natūralų pokalbio kalbą su neverbalinių garsų palaikymu, pavyzdžiui, juoko, sijonų ir kosulio. Dia palaiko daugiakalbio dialogo generavimą ir balso klonavimą iš 5-10 sekundžių atskaitos garso, todėl idealiai tinka realių pokalbių ir charakterių balsų kūrimui.
Pagrindinės savybės
Dialogo generavimas
Generuoti natūralius daugiakalbio pokalbio su atskirais balsais ir posūkio.
Neverbaliniai garsai
Įterpti [juokių], [sustiprintų], [sustiprintų], (sugeriančių) natūraliai paralingvistinei išraiškai.
Balso klonavimas
Apdoroti bet kokį balsą nuo 5-10 sekundžių atskaitos garso asmeniniu kalba.
Gamtinis pokalbis
1.6B parametrai sukuria labai natūralų pokalbį prozodija ir intonacija.
Naudoti atvejus
Kaip vartoti Dia
-
1
Užsiregistruokite nemokamai arba atidarykite demo
Sukurti nemokamą TextToSpeechAI paskyrą reikalauti savo pradedantiesiems kreditus, arba atidaryti be pasirašymo demo išbandyti Dia dialogas iš karto.
-
2
Pasirinkite Dia variklį
TTS prietaisų skydelyje Dia pasirenkamas iš variklių sąrašo. Dia yra į dialogą orientuotas, itin aukšto lygio modelis su daugiakalbiu ir balso klanavimu.
-
3
Įrašyti dialogo scenarijų su žymomis
Sukurkite savo pokalbį naudodami [S1] ir [S2] žymėdami kiekvieną garsiakalbį posūkyje ir įrašykite neverbalines žymas, pvz., [smegs], [suartėjimus], [sukas] arba (su) kur norite natūralių reakcijų.
-
4
Generuoti garsą
Spustelėkite generuoti siųsti savo Dia scenarijų į mūsų priestate GPUs. Dia perteikia dviejų garsiakalbių dialogą su įėjimo ir jūsų neverbaliniai žymes į vieną garso failą.
-
5
Atsisiųskite arba paskambinkite API
Parsisiųskite baigtą dialogą pasirinktu formatu, arba automatizuokite jį, siunčiant tą patį [S1]/[S2] scenarijų į TextToSpeechAI API su savo paskyros raktą.
Dia API
Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Sveiki! Kaip šiandien esate? [Smegsas] [S2] Aš darau puikiai, ačiū, kad klausi!",
"voice": "en_US-lessac-medium"
}'
Dažnai užduodami klausimai
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50