StyleTTS 2
UltraTexto a voz a nivel humano con transferencia de estilo
Acerca de StyleTTS 2
StyleTTS 2 logra la síntesis de texto a voz a nivel humano a través de la difusión de estilos y el entrenamiento contradictorio. Puede transferir estilos de habla desde audio de referencia mientras genera un habla altamente natural que rivaliza con grabaciones humanas reales. StyleTTS 2 representa el estado de la técnica en calidad y naturalidad TTS.
Características principales
Calidad a nivel humano
Produce el habla indistinguible de las grabaciones humanas en las pruebas a ciegas.
Transferencia de estilo
Transfiera el estilo de habla de cualquier muestra de audio de referencia.
Prosodia natural
Ritmo perfecto, estrés y entonación con modelado basado en la difusión.
Clonación de voz
Voces clonadas con excepcional precisión y naturalidad.
Inferencia rápida
Más rápido que los modelos autorregresivos mientras se mantiene la calidad.
Código abierto
MIT licenciado con derechos de uso comercial completo.
Casos de uso
StyleTTS 2 Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENCómo usar StyleTTS 2
-
1
Regístrate gratis o ejecuta la demo
Cree una cuenta gratuita TextToSpeechAI para obtener créditos de arranque o utilice la demo de la página de inicio para escuchar StyleTTS2 sin iniciar sesión.
-
2
Elija el motor StyleTTS2
Seleccione una voz StyleTTS2 de la biblioteca de voz. Para clonar una voz, cargue un clip de referencia de 10-30 segundos y StyleTTS2 transferirá su estilo.
-
3
Introduzca su texto
Pegue o escriba el guión que desee narrado. StyleTTS2 sobresale en inglés y ofrece prosodia natural, estrés y entonación a través de largos pasajes.
-
4
Generar el audio
Haga clic en generar y TextToSpeechAI renderiza su audio StyleTTS2 en GPU. StyleTTS2 ultra-tier cuesta 50 créditos por 1000 caracteres.
-
5
Descargue o utilice la API
Descargue el audio terminado de StyleTTS2 como MP3, WAV u OGG, o llame a la API TextToSpeechAI con su voz StyleTTS2 para automatizar la generación.
StyleTTS 2 API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS 2 produce un discurso tan natural que rivaliza con las grabaciones humanas profesionales.",
"voice": "styletts2-default"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50