Dia
UltraTTS orientované na dialog s hlasovým klonováním a neverbálními zvuky
O aplikaci Dia
Dia od Nari Labs je parametr 1.6B zaměřený na dialog text-to-speech model. Vyniká při vytváření přirozené konverzační řeč s podporou nonverbální zvuky jako smích, povzdechy a kašel. Dia podporuje multi-reaker dialog generování a hlasové klonování od 5-10 sekund referenčního zvuku, což je ideální pro vytváření realistických rozhovorů a hlasové postavy.
Klíčové funkce
Generování dialogu
Generovat přirozené multi-reproduktor konverzace s výraznými hlasy a obrat-braní.
Neverbální zvuky
Přidat [smích], [povzdechne], [kašle], (vzdechy) pro přirozený paralinguistický výraz.
Klonování hlasu
Klonujte jakýkoliv hlas z 5-10 sekund referenčního zvuku pro osobní projev.
Přírodní konverzace
1.6B parametry produkují vysoce přírodní konverzační prosody a intonaci.
Pouzdra na použití
Jak se používá Dia
-
1
Zaregistrujte se zdarma nebo otevřete demo
Vytvořte zdarma TextToSpeechAI účet pro nárok na startovací kredity, nebo otevřít demo no-signup vyzkoušet Dia dialog hned.
-
2
Vyberte motor Dia
V palubní desce TTS vyberte Dia ze seznamu motorů. Dia je model zaměřený na dialog, ultra-tier s podporou více reproduktorů a hlasového clonění.
-
3
Napsat dialogový skript s značkami
Složte svůj rozhovor pomocí [S1] a [S2] označit každý reproduktor otočit, a kapka v nonverbální značky, jako [smích], [povzdechne], [kašle], nebo (vzdechy) kde chcete přírodní reakce.
-
4
Generovat zvuk
Kliknutím na tlačítko generovat odeslat svůj Dia script do našich hostovaných GPU. Dia vykresluje dialog dvou reproduktorů s tahem a vaše neverbální značky do jediného zvukového souboru.
-
5
Stáhnout nebo zavolat API
Stáhněte si hotový dialog ve zvoleném formátu, nebo jej automatizujte zasláním stejného [S1]/[S2] skriptu do API TextToSpeechAI s vaším účtem.
Dia API
Generovat řeč programově pomocí TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Dobrý den! Jak se dnes máte? [smích] [S2] Vedu si skvěle, díky za optání!",
"voice": "en_US-lessac-medium"
}'
Často kladené otázky
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50