Zonos
UltraClonación de voz expresiva con control de emoción y estilo
Acerca de Zonos
Zonos by Zyphra es un modelo de texto a voz para parámetro 1.6B con avanzado control de la emoción y el estilo. Soporta la clonación de voz a partir de 5-30 segundos de audio de referencia y puede modular el tono emocional del discurso generado. Elija entre emociones como felicidad, tristeza, ira, miedo, sorpresa y disgusto para crear audio altamente expresivo y con matices emocionales.
Características principales
Control de emociones
Controla las emociones del habla: felicidad, tristeza, ira, miedo, sorpresa, disgusto y neutralidad.
Clonación de voz
Clonar cualquier voz a partir de 5-30 segundos de audio de referencia con alta fidelidad.
Discurso expresivo
Los parámetros 1.6B producen un habla altamente expresiva con una entrega emocional matizada.
Multilingüe
Soporta inglés, japonés, chino, francés y alemán.
Casos de uso
Cómo usar Zonos
-
1
Regístrese o abra la demo
Cree una cuenta gratuita TextToSpeechAI para obtener créditos de inicio o utilice la demo sin registro para probar Zonos de inmediato.
-
2
Elija el motor Zonos
Seleccione Zonos desde el selector de voz y modelo. Para clonar una voz, cargue 5-30 segundos de audio de referencia limpio para que Zonos pueda coincidir con el altavoz.
-
3
Introduzca su texto
Escribe o pega el guión que quieras que se hable. Zonos trabaja en inglés, japonés, chino, francés y alemán.
-
4
Escoge una emoción y genera
Elija una de las siete emociones Zonos - neutral, felicidad, tristeza, ira, miedo, sorpresa o disgusto - a continuación, haga clic en generar para hacer un discurso expresivo en ese estado de ánimo.
-
5
Descargue o utilice la API
Reproduce y descarga el audio terminado, o llama al mismo motor Zonos programáticamente a través de la API de TextToSpeechAI REST para flujos de trabajo automatizados.
Zonos API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos genera un discurso increíblemente expresivo con un control emocional de grano fino.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50