F5-TTS
PremiumTexto a voz rápido, fluido y fiel con clonación
Acerca de F5-TTS
F5-TTS es un modelo de texto a voz no regresivo que logra una rápida inferencia manteniendo la alta calidad y apoyando la clonación de voz. Utilizando técnicas de emparejamiento de flujo, genera habla natural con excelente fluidez y fidelidad a las voces de referencia. F5-TTS ofrece un gran equilibrio entre velocidad, calidad y capacidad de clonación.
Características principales
Generación rápida
Arquitectura no autorregresiva para síntesis rápida del habla.
Clonación cero-caliente
Clonar cualquier voz de una muestra de audio corta sin ajuste fino.
Alta fidelidad
El ajuste de flujo produce una salida de voz natural y de alta calidad.
Fluidez natural
Prosodia suave y ritmo natural en todo.
Multilingüe
Soporta varios idiomas con pronunciación natural.
Código abierto
MIT con licencia para uso comercial completo.
Casos de uso
Cómo usar F5-TTS
-
1
Regístrate gratis o abre la demo
Crear una cuenta gratuita TextToSpeechAI para recibir créditos de inicio, o saltar directamente a la demostración gratuita para probar F5-TTS sin necesidad de pago.
-
2
Elija F5-TTS y (opcionalmente) cargue un clip de referencia
Seleccione F5-TTS como su motor. Para clonar una voz, cargue una breve muestra de referencia de 10-30 segundos del altavoz de destino para que F5-TTS pueda capturar su tono y acento cero-shot; omita este paso para usar una voz F5-TTS incorporada.
-
3
Introduzca su texto
Escriba o pegue el texto que desea que se hable. F5-TTS lo lee naturalmente en su voz elegida o clonada, con una prosodia suave a través de varios idiomas soportados.
-
4
Generar el discurso
Haga clic en generar y F5-TTS sintetiza rápidamente su audio en nuestra infraestructura GPU, facturado a la tasa Premium de 25 créditos por 1000 caracteres.
-
5
Descargue o utilice la API
Descargue el audio terminado como MP3, WAV o OGG, o llame a la API TextToSpeechAI con su ID de voz F5-TTS para automatizar la generación en sus propias aplicaciones.
F5-TTS API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "F5\u002DTTS ofrece habla rápida y fluida con impresionantes capacidades de clonación de voz.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 3-4GB
- Credits/1000 chars 25