TTS de bolsillo
StandardClonación de voz ultraligera que se ejecuta en tiempo real en la CPU
Acerca de TTS de bolsillo
Pocket TTS by Kyutai es un modelo de texto a voz ultraligero para parámetros de 100M que funciona en tiempo real en la CPU. A pesar de su pequeño tamaño, es compatible con la clonación de voz a partir de sólo 5 segundos de audio de referencia. Perfecto para la implementación de edge, aplicaciones móviles y escenarios donde los recursos de GPU son limitados.
Características principales
Peso ultraligero
Parámetros 100M - se ejecuta en tiempo real en la CPU con recursos mínimos.
Clonación de voz
Clonar cualquier voz de sólo 5 segundos de audio de referencia, incluso en la CPU.
Tiempo real en la CPU
No se requiere GPU. Genera discurso a velocidad en tiempo real en hardware estándar.
Listos para el borde
Lo suficientemente pequeño para dispositivos móviles, Raspberry Pi y sistemas integrados.
Casos de uso
Cómo usar TTS de bolsillo
-
1
Regístrate gratis o prueba la demo
Cree una cuenta gratuita TextToSpeechAI para recibir créditos de inicio, o utilice la demo en el sitio para escuchar Pocket TTS antes de registrarse. No se necesita GPU ni instalación local.
-
2
Seleccione Pocket TTS y agregue una voz a clonar
Elija Pocket TTS como su motor, luego cargue un clip de referencia corto de unos 5 a 10 segundos para clonar esa voz. Pocket TTS funciona completamente en la CPU, por lo que la clonación es rápida y ligera.
-
3
Introduzca su texto
Escriba o pegue el texto en inglés o francés que desee hablar. Mantenga un ojo en el recuento de caracteres, ya que Pocket TTS cuentas a la tasa estándar de 10 créditos por 1.000 caracteres.
-
4
Generar el audio
Haga clic en generar y Pocket TTS sintetiza su texto en la voz clonada a velocidad en tiempo real. La mayoría de los clips están listos en segundos porque el modelo es tan pequeño y eficiente con la CPU.
-
5
Descargue o utilice la API
Descargue el audio terminado o automatice la generación a través de la API de TextToSpeechAI REST en api.texttospeechai.com usando su token de cuenta. La API expone la misma clonación y síntesis de TTS de bolsillo para sus propias aplicaciones.
TTS de bolsillo API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS ofrece clonación de voz que se ejecuta en tiempo real, incluso en la CPU.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10