Dia
UltraPárbeszédorientált TTS hang klónozással és nem verbális hangokkal
About Dia
Dia by Nari Labs egy 1.6B paraméterű párbeszéd-központú szöveg-speech modell. Kiemelkedően alkalmas a természetes társalgási beszédek létrehozására, olyan nem verbális hangok támogatásával, mint a nevetés, sóhajok és köhögés. Dia támogatja a több hangszórós párbeszéd generáció és a hang klónozás 5-10 másodperc referencia audió, így ideálissá teszi a reális beszélgetések és karakterhangok.
Kulcsfontosságú jellemzők
Párbeszéd-teremtés
Természetes több hangszórós beszélgetések generálása különböző hangokkal és fordulatokkal.
Nem verbális hangok
Hozzáadjuk a természetes paralinguista kifejezéshez.
Hang klónozása
Klón bármilyen hang 5-10 másodperc referencia hang személyre szabott beszéd.
Természetes beszélgetés
1.6B paraméterek nagyon természetes társalgási proszódiát és intonációt eredményeznek.
Esetek használata
Hogyan kell alkalmazni? Dia
-
1
Regisztráljon ingyen vagy nyissa meg a demót
Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy az indító krediteket követelje, vagy nyissa meg a no-signup demót, hogy kipróbálja a Dia párbeszédet azonnal.
-
2
Válassza ki a Dia motort
A TTS műszerfalon válassza Dia-t a motorlistából. Dia a párbeszédorientált, ultra-tier modell több hangszóróval és hangklónusos támogatással.
-
3
Írj egy párbeszéd szkriptet címkékkel
A beszélgetést az [S1] és [S2] szónoki fordulatok megjelölésére használja, és olyan nem verbális címkéket dob be, mint [nevet], [sóhajt], [köhög] vagy (zúg) ahol természetes reakciókat szeretne.
-
4
Hang generálása
Kattintson a generálásra, hogy küldje el a Dia scriptet a házigazdánk GPU-k. Dia teszi a két hangszórós párbeszéd a fordulat-vétel és a nonverbal címkék egyetlen audio fájlba.
-
5
Letöltés vagy hívja az API
Töltse le a befejezett párbeszédet a választott formátumban, vagy automatizálja ugyanazt a [S1]/[S2] szkriptet a TextToSpeechAI API-ra a fiókja zsetonjával.
Dia API
A beszéd programszerű generálása a TextToSpeechAI REST API használatával.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Helló, hogy vagy ma?",
"voice": "en_US-lessac-medium"
}'
Gyakran ismételt kérdések
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50