Kokoro
StandardFálger-rápido, TTS leve com qualidade natural
Sobre Kokoro
Kokoro é um parâmetro de peso ultra leve modelo TTS 82M que oferece fala natural a uma velocidade incrível. Ele funciona quase em tempo real mesmo na CPU, tornando-o ideal para aplicações onde a latência baixa é crítica. Kokoro suporta múltiplos idiomas e oferece capacidades de mistura de voz.
Características-chave
Peso ultra-luz
Parâmetros 82M, tamanho do modelo ~300MB. Execução na CPU com recursos mínimos.
Perto do tempo real
Gera a fala mais rápido do que a velocidade de reprodução, mesmo sem aceleração GPU.
Multi-Língua
Apoia inglês, francês, espanhol, hindi, japonês, chinês, italiano, português e coreano.
Mistura de voz
Misture duas vozes para criar combinações de voz únicas.
Casos de utilização
Como Utilizar Kokoro
-
1
Inscreva-se gratuitamente ou tente a demo
Crie uma conta TextToSpeechAI gratuita para obter 200 créditos de início, ou use a demo de não assinatura para ouvir Kokoro instantaneamente. A camada padrão significa que Kokoro custa apenas 10 créditos por 1000 caracteres.
-
2
Escolha uma voz de Kokoro
Abra o navegador de voz e selecione uma voz Kokoro na sua língua-alvo (9 suportadas, do inglês ao japonês e ao coreano). Você também pode usar a mistura de voz Kokoro para misturar duas vozes numa combinação personalizada.
-
3
Insira o seu texto
Digite ou cole o texto que você quer falar no editor. Kokoro maneja passagens longas eficientemente graças ao seu leve parametro 82M, quase em tempo real.
-
4
Ajustar a velocidade e gerar
Definir a velocidade de reprodução para se ajustar ao seu caso de uso, e então clique em Gerar. Kokoro rende áudio mais rápido do que em tempo real, por isso sua fala está pronta quase imediatamente.
-
5
Baixe ou use a API
Baixe o áudio acabado como MP3 ou WAV, ou automatize a geração através da TextToSpeechAI REST API em api.texttospeechai.com para cargas de trabalho em lote e em tempo real.
Kokoro API
Gerar a fala programática usando a API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro oferece fala natural com velocidade e eficiência incríveis.",
"voice": "en_US-lessac-medium"
}'
Perguntas Frequentes
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10