Dia
UltraTTS orienté dialogue avec clonage vocal et sons non verbaux
À propos Dia
Dia by Nari Labs est un modèle de dialogue texte-à-parleur de 1,6B. Il excelle dans la génération de discours conversationnels naturels avec support pour les sons non verbaux comme le rire, les soupirs et la toux. Dia supporte la génération de dialogue multi-parleurs et le clonage de la voix à partir de 5-10 secondes de référence audio, ce qui le rend idéal pour créer des conversations réalistes et des voix de caractère.
Caractéristiques principales
Génération du dialogue
Générer des conversations multi-parleurs naturelles avec des voix distinctes et des prises de tour.
Sons non verbaux
Ajouter [rires], [soupires], [toux], (goutte) pour l'expression paralinguistique naturelle.
Clonage de la voix
Clone toute voix de 5-10 secondes de son de référence pour une parole personnalisée.
Conversation naturelle
1.6B paramètres produisent prosody conversationnelle très naturelle et l'intonation.
Cas d'utilisation
Comment utiliser Dia
-
1
Inscrivez-vous gratuitement ou ouvrez la démo
Créez un compte gratuit TextToSpeechAI pour réclamer vos crédits de démarrage, ou ouvrez la démo sans signature pour essayer le dialogue Dia immédiatement.
-
2
Sélectionnez le moteur Dia
Dans le tableau de bord TTS, choisissez Dia dans la liste des moteurs. Dia est le modèle de dialogue, ultra-tier avec multi-enceinte et support de fermeture vocale.
-
3
Écrire un script de dialogue avec des balises
Composez votre conversation en utilisant [S1] et [S2] pour marquer chaque tour d'enceinte, et déposez des étiquettes non verbales telles que [rires], [soupirs], [toux] ou (gouttes) où vous voulez des réactions naturelles.
-
4
Générer l'audio
Cliquez sur générer pour envoyer votre script Dia à nos GPU hébergés. Dia rend le dialogue à deux haut-parleurs avec tour-prise et vos balises non verbales dans un seul fichier audio.
-
5
Télécharger ou appeler l'API
Téléchargez le dialogue terminé dans le format choisi, ou automatisez-le en affichant le même script [S1]/[S2] dans l'API TextToSpeechAI avec votre jeton de compte.
Dia API
Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Bonjour! Comment allez\u002Dvous aujourd\u0027hui? [rires] [S2] Je fais très bien, merci de demander!",
"voice": "en_US-lessac-medium"
}'
Foire aux questions
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50