Pocket TTS
Standardclonagem de voz ultra-peso leve que funciona em tempo real na CPU
Sobre Pocket TTS
Pocket TTS by Kyutai é um modelo de texto a voz de 100M ultra-luz que funciona em tempo real na CPU. Apesar do seu pequeno tamanho, suporta a clonagem de voz a partir de apenas 5 segundos de áudio de referência. Perfeito para a implantação de bordas, aplicações móveis e cenários onde os recursos da GPU são limitados. Atualmente suporta inglês e francês.
Características-chave
Peso ultra-luz
Parâmetros 100M - executa em tempo real na CPU com recursos mínimos.
Clonagem Voz
Clone qualquer voz a partir de apenas 5 segundos de áudio de referência, mesmo na CPU.
Tempo real na CPU
Não é necessário GPU. Gera fala em tempo real em hardware padrão.
Edge- Ready
Pequeno o suficiente para dispositivos móveis, Raspberry Pi e sistemas incorporados.
Casos de utilização
Como Utilizar Pocket TTS
-
1
Inscreva-se gratuitamente ou tente a demo
Crie uma conta TextToSpeechAI gratuita para receber créditos de arranque, ou use a demo no local para ouvir o Pocket TTS antes de se inscrever. Não é necessário instalar GPU ou local.
-
2
Selecione Pocket TTS e adicione uma voz ao clone
Escolha Pocket TTS como seu motor, então carregue um pequeno clipe de referência de cerca de 5 a 10 segundos para clonar essa voz. Pocket TTS funciona inteiramente na CPU, então clonar é rápido e leve.
-
3
Insira o seu texto
Digite ou cole o texto inglês ou francês que você deseja falar. Mantenha um olho na contagem de caracteres, já que Bills de TTS Pocket à taxa padrão de 10 créditos por 1.000 caracteres.
-
4
Gerar o áudio
Clique em gerar e Pocket TTS sintetizar o seu texto na voz clonada à velocidade em tempo real. A maioria dos clipes estão prontos em segundos porque o modelo é tão pequeno e eficiente em CPU.
-
5
Baixe ou use a API
Baixe a geração de áudio finalizada ou automatize através da API TextToSpeechAI REST em api.texttospeechai.com usando o token da sua conta. A API expõe a mesma clonagem e síntese do Pocket TTS para seus próprios aplicativos.
Pocket TTS API
Gerar a fala programática usando a API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS oferece clonagem de voz que funciona em tempo real, mesmo na CPU.",
"voice": "en_US-lessac-medium"
}'
Perguntas Frequentes
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10