OpenVoice
UltraClonación de voz instantánea con control de tono granular
Acerca de OpenVoice
OpenVoice es un versátil modelo de clonación instantánea de voz que permite un control fino sobre el estilo de hablar. A diferencia de otros modelos de clonación, OpenVoice separa la identidad de voz del estilo de hablar, lo que le permite tomar una voz clonada y aplicar diferentes tonos - alegre, triste, enojado, emocionado, o susurrar - sin nuevo audio de referencia.
Características principales
Clonación instantánea
Clonar cualquier voz de sólo unos segundos de audio.
Control tonal
Aplicar tonos alegres, tristes, enojados, emocionados o susurrantes.
Transferencia de estilo
Separar la identidad de voz del estilo de hablar para mayor flexibilidad.
Interlingüe
Utilice voces clonadas en diferentes idiomas.
Procesamiento rápido
Deducción eficiente para una rápida generación de voz.
Código abierto
MIT licenciado para aplicaciones comerciales.
Casos de uso
Cómo usar OpenVoice
-
1
Regístrate gratis o prueba la demo
Crear una cuenta gratuita TextToSpeechAI para obtener créditos de inicio, o utilizar la demo en la página para escuchar OpenVoice antes de comprometerse. No se necesita GPU local o instalar - todo se ejecuta en nuestros servidores.
-
2
Elija OpenVoice y cargue un clip de referencia
Seleccione el motor OpenVoice y luego cargue unos segundos de audio de referencia limpio para clonar instantáneamente la voz de destino. OpenVoice captura la identidad del altavoz para que pueda reutilizarlo a través de cualquier texto y tono.
-
3
Introduzca su texto
Escriba o pegue el script que desea que se hable en la voz clonada. OpenVoice soporta alrededor de 10 idiomas y entregas multilingües, para que pueda escribir en un idioma diferente al clip de referencia.
-
4
Elija un estilo de tono y generar
Elija uno de los nueve estilos de tono OpenVoice - predeterminado, amistoso, alegre, emocionado, triste, enojado, aterrorizado, gritando o susurrando - a continuación, generar. La misma voz clonada hablará con esa entrega emocional.
-
5
Descargue o utilice la API
Descargue su audio como MP3, WAV, o OGG, o automatice la generación a través de la API TextToSpeechAI pasando su voz clonada y estilo de tono en cada solicitud.
OpenVoice API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "OpenVoice puede hablar en cualquier tono \u002D alegre, triste, o incluso susurrar.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50