GPT-SoVITS
PremiumClonación de voz de pocas imágenes con la más alta calidad de salida
Acerca de GPT-SoVITS
GPT-SoVITS combina el modelado de lenguaje estilo GPT con la conversión de voz SoVITS para lograr la clonación de voz de pocas imágenes de última generación. Con sólo 3-10 segundos de audio de referencia más una transcripción, produce un discurso notablemente natural que coincide estrechamente con la voz objetivo. Sobresale en la síntesis interlingüe - entrenar en un idioma y generar en otro.
Características principales
Clonación de voz de poca intensidad
Clonar cualquier voz de 3-10 segundos de audio de referencia con una transcripción para la mejor calidad.
Síntesis transversal
Entrena en un idioma y genera habla en chino, inglés, japonés, coreano o cantonés.
Calidad más alta
GPT-SoVITS se sitúa constantemente entre los modelos de clonación de voz de más alta calidad disponibles.
Código abierto
Completamente MIT licenciado con desarrollo comunitario activo y documentación extensa.
Casos de uso
Cómo usar GPT-SoVITS
-
1
Crear una cuenta gratuita o abrir la demo
Regístrese para recibir TextToSpeechAI créditos de arranque gratuitos, o ir directamente a la demo para probar GPT-SoVITS sin necesidad de registrarse.
-
2
Seleccione GPT-SoVITS y cargue un clip de referencia
Elija GPT-SoVITS como su motor, luego cargue un clip de referencia de 3-10 segundos de la voz que desea clonar. Agregar la transcripción de ese clip da el clon más limpio y más preciso.
-
3
Introduzca su texto
Escriba o pegue el texto que desea que se hable en la voz clonada. GPT-SoVITS es compatible con el chino, inglés, japonés, coreano y cantonés, incluida la clonación multilingüe de una referencia en otro idioma.
-
4
Generar el audio
Haga clic en generar para enviar el trabajo a nuestros servidores GPU. GPT-SoVITS renderiza un discurso clonado de excelente calidad a velocidad media, con 25 créditos facturados por cada 1.000 caracteres.
-
5
Descargue o utilice la API
Descargue el audio GPT-SoVITS terminado como archivo o automatice la generación a través de la API de TextToSpeechAI REST en api.texttospeechai.com para flujos de trabajo de producción.
GPT-SoVITS API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS produce la clonación de voz de la más alta calidad a partir de sólo unos segundos de audio.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25