CosyVoice2
PremiumClonación de voz multilingüe de tiro cero con soporte de streaming
Acerca de CosyVoice2
CosyVoice2 es un modelo de síntesis de voz de próxima generación de FunAudioLLM (Alibaba). Ofrece clonación de voz de sonido natural sin disparos a través de varios idiomas con capacidad de transmisión para aplicaciones de baja latencia. Construido sobre un enfoque de cuantificación escalar finito, logra una excelente similitud de voz con sólo unos segundos de audio de referencia.
Características principales
Clonación de voz cero-caliente
Clonar cualquier voz de 3-10 segundos de audio de referencia con alta fidelidad.
Multilingüe
Soporta chino, inglés, japonés, coreano y cantonés con síntesis interlingüe.
Apoyo a la transmisión
Modo de streaming de baja latencia para aplicaciones en tiempo real y sistemas interactivos.
Prosodia natural
El modelado prosodiado avanzado produce un sonido natural del habla con la entonación apropiada.
Casos de uso
Cómo usar CosyVoice2
-
1
Regístrese y reclame créditos gratuitos
Cree una cuenta gratuita TextToSpeechAI para reclamar sus créditos de inicio, o intente primero la demo. No se necesita ninguna instalación local de GPU o CosyVoice2 - todo se ejecuta en nuestra infraestructura.
-
2
Seleccione CosyVoice2 y agregue un clip de referencia
Elija CosyVoice2 como su motor, luego cargue una grabación de referencia limpia de 3-10 segundos de la voz que desea clonar. CosyVoice2 extraerá las características del altavoz para la clonación multilingüe de cero disparos.
-
3
Introduzca su texto en cualquier idioma soportado
Escriba o pegue su guión en chino, inglés, japonés, coreano o cantonés. CosyVoice2 admite síntesis multilingüe, por lo que la voz clonada puede hablar un idioma diferente del clip de referencia.
-
4
Generar el discurso
Haga clic en generar y CosyVoice2 sintetiza el habla natural y multilingüe en la voz clonada, por lo general en cuestión de segundos para texto corto.
-
5
Descargue o utilice la API
Descargue el audio terminado como MP3 o WAV desde su historial, o automatice la clonación de voz de CosyVoice2 a escala a través de la API de TextToSpeechAI REST.
CosyVoice2 API
Generar voz programáticamente usando la API de TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 ofrece un lenguaje multilingüe natural con capacidad de clonación de voz de cero disparos.",
"voice": "en_US-lessac-medium"
}'
Preguntas frecuentes
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25