Kokoro
StandardRelámpago rápido, ligero TTS con calidad natural
Acerca de Kokoro
Kokoro es un modelo TTS para parámetros ultraligeros de 82M que ofrece un sonido natural a una velocidad increíble. Funciona casi en tiempo real incluso en la CPU, por lo que es ideal para aplicaciones donde la latencia baja es crítica. Kokoro es compatible con varios idiomas y ofrece capacidades de mezcla de voz.
Características principales
Peso ultraligero
Parámetros 82M, tamaño del modelo ~300MB. Se ejecuta en la CPU con recursos mínimos.
Cerca de tiempo real
Genera el habla más rápido que la velocidad de reproducción, incluso sin aceleración de GPU.
Multilingüe
Soporta inglés, francés, español, hindi, japonés, chino, italiano, portugués y coreano.
Mezcla de voz
Mezcla dos voces para crear combinaciones de voz únicas.
Casos de uso
Cómo usar Kokoro
-
1
Regístrate gratis o prueba la demo
Crear una cuenta gratuita TextToSpeechAI para obtener 200 créditos de arranque, o utilizar la demo sin registro para escuchar Kokoro al instante. El nivel estándar significa que Kokoro sólo cuesta 10 créditos por cada 1000 caracteres.
-
2
Escoge una voz Kokoro
Abre el navegador de voz y selecciona una voz de Kokoro en tu idioma de destino (9 compatible, desde inglés hasta japonés y coreano). También puedes usar la mezcla de voz de Kokoro para mezclar dos voces en una combinación personalizada.
-
3
Introduzca su texto
Escribe o pega el texto que quieras que se hable en el editor. Kokoro maneja pasajes largos de manera eficiente gracias a su ligero parámetro 82M, casi en tiempo real.
-
4
Ajustar la velocidad y generar
Establezca la velocidad de reproducción para adaptarse a su caso de uso, a continuación, haga clic en Generar. Kokoro renderiza audio más rápido que en tiempo real, por lo que su discurso está listo casi inmediatamente.
-
5
Descargue o utilice la API
Descargue el audio terminado como MP3 o WAV, o automatice la generación a través de la API de TextToSpeechAI REST en api.texttospeechai.com para cargas de trabajo por lotes y en tiempo real.
Kokoro API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro ofrece habla natural con una velocidad y eficiencia increíbles.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10