OpenVoice
UltraClonagem instantânea de voz com controle de tons granulares
Sobre OpenVoice
O OpenVoice é um modelo de clonagem instantânea versátil que permite o controle de brilho fino sobre o estilo de fala. Ao contrário de outros modelos de clonagem, o OpenVoice separa a identidade de voz do estilo de fala, permitindo que você tome uma voz clonada e aplique diferentes tons - alegres, tristes, zangados, excitados ou sussurros - sem novo áudio de referência.
Características-chave
Enchimento Instantâneo
Clone qualquer voz de apenas alguns segundos de áudio.
Controlo de tons
Aplicar tons alegres, tristes, zangados, animados ou sussurros.
Transferência de Estilo
Identidade de voz separada do estilo de fala para flexibilidade.
Lingüais cruzados
Use vozes clonadas em diferentes idiomas.
Processamento Rápido
Inferência eficiente para a geração rápida de voz.
Fonte Aberta
MIT licenciado para aplicações comerciais.
Casos de utilização
Como Utilizar OpenVoice
-
1
Inscreva-se gratuitamente ou tente a demo
Crie uma conta TextToSpeechAI gratuita para obter créditos de arranque, ou use a demo na página para ouvir OpenVoice antes de cometer. Não é necessário GPU local ou instalação - tudo funciona em nossos servidores.
-
2
Escolha OpenVoice e upload um clipe de referência
Selecione o motor OpenVoice, então envie alguns segundos de áudio de referência limpo para clonar instantaneamente a voz alvo. OpenVoice captura a identidade do alto-falante para que você possa reutiliza-lo em qualquer texto e tom.
-
3
Insira o seu texto
Digite ou cole o script que você quer falado na voz clonada. OpenVoice suporta cerca de 10 idiomas e entregas translingües, para que você possa escrever em uma língua diferente do clipe de referência.
-
4
Escolha um estilo de tom e gerar
Escolha um dos nove estilos de tom OpenVoice - padrão, amigável, alegre, excitado, triste, zangado, aterrorizado, gritando ou sussurro - então gerar. A mesma voz clonada falará com essa entrega emocional.
-
5
Baixe ou use a API
Baixe o seu áudio como MP3, WAV, ou OGG, ou automatize a geração através da API TextToSpeechAI passando seu estilo de voz e tom clonado em cada pedido.
OpenVoice API
Gerar a fala programática usando a API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "OpenVoice pode falar em qualquer tom \u002D alegre, triste, ou até mesmo sussurro.",
"voice": "en_US-lessac-medium"
}'
Perguntas Frequentes
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50