Dia
UltraDialoogile orienteeritud TTS häälkloonimise ja mitteverbaalsete helidega
Info Dia
Dia by Nari Labs on 1,6B parameeter dialoogi keskendunud teksti-kõne mudel. See on suurepärane luua loomulik vestluskõne toel mitteverbaalne kõlab nagu naer, ohkab, ja köha. Dia toetab multi-kõlar dialoogi põlvkonna ja hääl kloonimine 5-10 sekundit viide heli, muutes see ideaalne luua realistlik vestlusi ja iseloomu hääled.
Peamised omadused
Dialoogi loomine
Luua loomulik multi-kõneleja vestlusi erinevate häälte ja pöördega.
Mitteverbaalsed helid
Lisage [laughs], [ohkab], [köha], (gasps) loomulik paralingvistlik väljendus.
Hääle kloonimine
Kloon iga hääl alates 5-10 sekundit viide heli isikupärastatud kõne.
Loomulik vestlus
1.6B parameetrid tekitavad väga loomuliku vestluse prosoodia ja intonatsiooni.
Kasutusklassid
Kuidas kasutada Dia
-
1
Registreeru tasuta või ava demo
Loo tasuta TextToSpeechAI konto nõuda oma starter krediiti, või avada no-signup demo proovida Dia dialoogi kohe.
-
2
Diamootori valimine
In TTS armatuurlaua valida Dia mootori nimekirja. Dia on dialoogi orienteeritud, ultra-tier mudel multi-kõlar ja hääl-kloonimine toetust.
-
3
Dialoogiskripti kirjutamine siltidega
Koosta oma vestlus kasutades [S1] ja [S2] tähistada iga kõneleja omakorda, ja tilk nonverbal sildid nagu [laughs], [ohkab], [köha] või (gasps) kus soovite loomulikke reaktsioone.
-
4
Audio genereerimine
Klõpsake genereerida saata oma Dia skript meie majutatud GPUs. Dia muudab kahe kõneleja dialoogi omakorda-võte ja oma mitteverbaalne sildid ühte helifaili.
-
5
API allalaadimine või helistamine
Lae valmis dialoog oma valitud formaadis, või automatiseerida seda postitades sama [S1] / [S2] skripti TextToSpeechAI API oma konto märgiga.
Dia API
Loo kõne programmiliselt kasutades TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Tere, kuidas sul täna läheb?",
"voice": "en_US-lessac-medium"
}'
Korduma kippuvad küsimused
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50