Dia
UltraVuoropuheluun perustuva TTS, jossa on äänen kloonaus ja ei-sanallisia ääniä
Tietoja Dia
Dia by Nari Labs on 1,6B-parametrin dialogin keskittämä teksti-puhe-malli. Dia on erinomainen saamaan aikaan luonnollista keskustelupuhetta, jolla tuetaan nonverbal-ääniä, kuten naurua, huokauksia ja yskimistä. Dia tukee monikielisten dialogien sukupolvea ja äänen kloonausta 5-10 sekunnin mittaisesta referenssiäänestä, mikä tekee siitä ihanteellisen realistisen keskustelun ja luonneäänten syntymiseen.
Tärkeimmät ominaisuudet
Vuoropuhelusukupolvi
Luo luo luonnollisia monikielisiä keskusteluja eri äänillä ja kääntämällä.
Sanattomat äänet
Lisää [naurua], [huiskua], (hymyä) luonnolliseen paralinguistiseen ilmaisuun.
Äänien kloonaus
Kloonaaa minkä tahansa äänen 5-10 sekunnin referenssiäänestä henkilökohtaiseen puheeseen.
Luonnollinen keskustelu
1.6B-parametrit tuottavat erittäin luontevaa keskusteluprosodiaa ja intonaatiota.
Käytä tapauksia
Miten sitä käytetään Dia
-
1
Rekisteröidy ilmaiseksi tai avaa demo
Luo ilmainen TextToSpeechAI-tili, jolla voit hakea starttitilisi, tai avaa signup-demo ja kokeile Dia-dialogia heti.
-
2
Valitse Dia-moottori
TTS-kojelaudassa Dia valitaan moottorilistalta. Dia on dialogipainotteinen, ultratason malli, jossa on monikaiutin ja äänensulkeva tuki.
-
3
Kirjoita dialogiskripti tageilla
Muodosta keskustelusi [S1:n] ja [S2:n] avulla jokaisen puhujan kääntymisen merkiksi ja pudota sanattomiin tunnisteisiin, kuten [naura], [hisku], [hymyily] tai (haastattele) sinne, missä haluat luonnollisia reaktioita.
-
4
Luo ääni
Klikkaa luodaksesi lähettää Dia-skriptisi isännöidyille GPU:ille. Dia tekee kaksikielisen dialogin vuorosanoilla ja sanattomilla tageillasi yhdeksi äänitiedostoksi.
-
5
Lataa tai soita sovellusliittymään
Lataa valmis dialogi valitsemallasi kokoonpanolla tai automatisoi se lähettämällä sama [S1]/[S2]-skripti TextToSpeechAI API:lle tilitunnuksellasi.
Dia API
Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Hei, miten voit tänään?",
"voice": "en_US-lessac-medium"
}'
Usein kysyttyjä kysymyksiä
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50