Dia
UltraTTS orientada al diálogo con clonación de voz y sonidos no verbales
Acerca de Dia
Dia by Nari Labs es un modelo de diálogo de texto a voz centrado en el parámetro 1.6B. Sobresale en generar un discurso conversacional natural con soporte para sonidos no verbales como risas, suspiros y tos. Dia es compatible con la generación de diálogos multiparlantes y la clonación de voz a partir de 5-10 segundos de audio de referencia, por lo que es ideal para crear conversaciones realistas y voces de carácter.
Características principales
Generación del diálogo
Generar conversaciones naturales multi-parlantes con voces distintas y turn-taking.
Sonidos no verbales
Añadir [risas], [suspira], [tos], (jadeos) para la expresión paralingüística natural.
Clonación de voz
Clonar cualquier voz de 5-10 segundos de audio de referencia para un discurso personalizado.
Conversación natural
Los parámetros 1.6B producen prosodia y entonación conversacional altamente natural.
Casos de uso
Cómo usar Dia
-
1
Regístrate gratis o abre la demo
Cree una cuenta gratuita TextToSpeechAI para reclamar sus créditos de inicio, o abra la demo sin registro para probar el diálogo Dia de inmediato.
-
2
Seleccione el motor Dia
En el tablero TTS elija Dia de la lista de motores. Dia es el modelo orientado al diálogo, ultra-tier con soporte multi-parlante y de voz-clonación.
-
3
Escribir un guión de diálogo con etiquetas
Componga su conversación usando [S1] y [S2] para marcar cada giro del altavoz, y deje caer etiquetas no verbales como [risas], [suspiros], [tos] o (jadeos) donde desee reacciones naturales.
-
4
Generar el audio
Haga clic en generar para enviar su script Dia a nuestras GPUs alojadas. Dia renderiza el diálogo de dos altavoces con toma de turnos y sus etiquetas no verbales en un solo archivo de audio.
-
5
Descargue o llame a la API
Descargue el diálogo terminado en el formato elegido, o automatice el diálogo publicando el mismo script [S1]/[S2] en la API TextToSpeechAI con el token de su cuenta.
Dia API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] ¡Hola! ¿Cómo estás hoy? [risas] [S2] ¡Lo estoy haciendo genial, gracias por preguntar!",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50