Qwen3-TTS
PremiumTTS multilingüe con clonación de voz de 3 segundos en 10 idiomas
Acerca de Qwen3-TTS
Qwen3-TTS de Alibaba es un modelo de texto a voz de parámetro 0.6B que combina alta calidad con una inferencia eficiente. Soporta 10 idiomas y puede clonar cualquier voz a partir de solo 3 segundos de audio de referencia. Construido sobre la arquitectura Qwen3, produce un sonido natural con excelente prosodia y pronunciación en todos los idiomas soportados.
Características principales
Clonación de voz de 3 segundos
Clonar cualquier voz a partir de sólo 3 segundos de audio de referencia - la clonación más rápida en la industria.
10 Idiomas
Chino, inglés, japonés, coreano, francés, alemán, español, italiano, portugués y ruso.
Inferencia eficiente
Parámetros 0.6B para inferencia rápida mientras se mantiene la salida de alta calidad.
Prosodia natural
Construido sobre la arquitectura Qwen3 para el habla con sonido natural con la entonación apropiada.
Casos de uso
Cómo usar Qwen3-TTS
-
1
Regístrese gratis o utilice la demo
Crear una cuenta gratuita TextToSpeechAI para obtener créditos de arranque, o probar la demo sin registro primero. No se necesita GPU o instalación local de Qwen3-TTS - todo se ejecuta en nuestros servidores.
-
2
Seleccione Qwen3-TTS y agregue un clip de 3 segundos
Elija Qwen3-TTS como su motor desde el selector de voz. Para clonar una voz, cargue un clip de referencia limpio de unos 3 segundos; para una voz no cerrada, simplemente elija una de las voces Qwen3-TTS incorporadas.
-
3
Introduzca su texto en cualquiera de los 10 idiomas
Escriba o pegue su guión en chino, inglés, japonés, coreano, francés, alemán, español, italiano, portugués o ruso. Qwen3-TTS puede hablar su voz clonada en los 10 idiomas compatibles.
-
4
Generar el discurso
Haga clic en generar y Qwen3-TTS sintetiza su audio en nuestras GPUs en el nivel premium (25 créditos por 1000 caracteres). El compacto modelo 0.6B devuelve el habla multilingüe natural rápidamente.
-
5
Descargue o utilice la API
Previsualizar el resultado, luego descargar el archivo de audio o obtenerlo programáticamente a través de la API TextToSpeechAI en api.texttospeechai.com. Reutilizar la misma voz clonada Qwen3-TTS para las generaciones futuras.
Qwen3-TTS API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Qwen3\u002DTTS ofrece un lenguaje multilingüe natural con la clonación de voz ultra rápida de 3 segundos.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 4-8GB
- Credits/1000 chars 25