Dia
UltraDialogorientert TTS med stemmekloning og ikke-verbale lyder
Om Dia
Dia av Nari Labs er en dialog med 1, 6B parametre, tekst til tale- modell med fokus på tekst. Den utmerker seg til å lage naturlig samtaletale med støtte for ikke- verbale lyder som latter, sukk og hoster. Dia støtter dialoggenerering med flere høyttalere og stemmekloning fra 5-10 sekunders referanselyd, noe som gjør det ideelt å lage realistiske samtaler og tegnstemmer.
Nøkkelfunksjoner
Lag dialog
Generer naturlige flertalersamtaler med tydelige stemmer og snu-taking.
Ikke- verbale lyder
Legg til [latter], [sukker], [hotes], (gisp) for naturlig paralinguistisk uttrykk.
Stemmekloning
Klone stemme fra 5-10 sekunder referanselyd for personlig tale.
Naturlig samtale
1.6B-parametrer gir svært naturlige konversasjonsprosodi og intonasjon.
Brukstilfeller
Bruksmåte Dia
-
1
Registrer deg gratis eller åpne demoen
Lag en ledig TextToSpeechAI konto for å kreve startkreditter, eller åpne demonen uten å signere for å forsøke Dia med en gang.
-
2
Velg Dia- motor
I TTS- instrumentbordet velg Dia fra motorlista. Dia er dialogmodellen med ultranivåstøtte med flere høyttalere og stemmekloning.
-
3
Skriv et dialogskript med etiketter
Skriv din samtale med [S1] og [S2] for å markere hver høyttaler snu, og fall i ikke-verbale tagger som [latter], [sukker], [hoste], eller (gisp) der du ønsker naturlige reaksjoner.
-
4
Lag lyd
Trykk på « Generer » for å sende ditt Dia- skript til våre GPU- er med vert. Dia tegner opp to- høyttaler- dialogen med tur- taing og dine ikke- verbale tagger til en enkelt lydfil.
-
5
Last ned eller ring API
Last ned det ferdige dialogvinduet i det formatet du har valgt, eller automatiser det ved å sende det samme [S1]/[S2] - skriptet til TextToSpeechAI API med kontosymbolet ditt.
Dia API
Generer taleprogrammatisk ved å bruke TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Hei der!",
"voice": "en_US-lessac-medium"
}'
Ofte stilte spørsmål
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50