Chatterbox

Premium

Clonación de voz de tiro cero con habla expresiva en 23 idiomas

Fast Velocidad
Very Good Calidad
Clonación
23 Idiomas

Acerca de Chatterbox

Chatterbox es un potente modelo de clonación de voz TTS de Resemble AI. Realiza la clonación de voz de tiro cero desde sólo unos segundos de audio de referencia, soportando 23 idiomas con expresión natural. Chatterbox incluye etiquetas paralingüísticas para añadir sonidos naturales como risas y tos al habla generada.

Características principales

Clonación de voz cero-caliente

Clonar cualquier voz de unos segundos de audio - no se requiere entrenamiento.

23 Idiomas

Del árabe al chino, que abarca la mayoría de los principales idiomas del mundo.

Etiquetas expresivas

Añadir [risa], [tos], [chuckle] para sonidos paralingüísticos naturales.

Inferencia rápida

Sub-200ms de latencia con la variante Turbo para aplicaciones en tiempo real.

Casos de uso

Clonación de voz para la creación de contenido Aplicaciones de voz multilingüe Diseño de voz de caracteres para juegos Asistentes de voz personalizados

Cómo usar Chatterbox

  1. 1

    Regístrese o abra la demo

    Crear una cuenta gratuita TextToSpeechAI para reclamar 200 créditos de inicio, o utilizar la demo en la página para probar Chatterbox sin iniciar sesión.

  2. 2

    Seleccione Chatterbox y agregue un clip de referencia

    Elija el motor Chatterbox y luego cargue un corto (unos segundos) clip de audio de la voz que desea clonar. Chatterbox clona al instante sin necesidad de entrenamiento.

  3. 3

    Introduzca su texto con etiquetas opcionales

    Escriba o pegue el texto para hablar en cualquiera de los 23 idiomas soportados, y deje caer [risas], [tos] o [chuckle] etiquetas donde quiera sonidos paralingüísticos naturales.

  4. 4

    Generar el discurso

    Haga clic en generar y TextToSpeechAI renderiza su texto en la voz de Chatterbox clonada en la infraestructura GPU alojada, gastando 25 créditos por 1.000 caracteres.

  5. 5

    Descargue o utilice la API

    Descargue el archivo de audio terminado o automatice la generación a través de la API de TextToSpeechAI REST en api.texttospeechai.com usando su token de cuenta.

Chatterbox API

Generar voz programáticamente usando la API de TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Chatterbox puede clonar tu voz desde solo unos segundos de audio y hablar en 23 idiomas.",
    "voice": "en_US-lessac-medium"
  }'

Preguntas frecuentes

Chatterbox es un modelo de clonación de voz de texto a voz de Resemble AI. Puede replicar cualquier voz a partir de solo unos segundos de audio de referencia y generar voz expresiva natural en 23 idiomas, todo ello sin ningún entrenamiento por voz.

Sí, Chatterbox está completamente licenciado MIT - tanto el código como los pesos del modelo - para que pueda usarlo libremente en productos comerciales. El audio generado incluye una marca de agua neuronal opcional que puede ser desactivada, y no hay regalías de uso.

Usted proporciona un breve clip de referencia de cualquier voz (un par de segundos es suficiente) y Chatterbox extrae el timbre y estilo de esa voz en un altavoz incrustado. A continuación, genera un discurso nuevo en esa voz sin ajuste fino o paso de entrenamiento, que es lo que "cero tiro" significa.

Chatterbox lee etiquetas especiales en línea en su texto para añadir sonidos naturales no verbales: [risa] inserta risas, [tos] inserta una tos, e [chuckle] inserta una risa suave. Simplemente coloque una etiqueta donde desee el sonido, por ejemplo "Eso es hilarante [risa] pero en serio...".

Escriba la etiqueta directamente dentro de su texto de entrada en el lugar donde debe ocurrir el sonido, rodeado por el resto de su oración. Chatterbox renderiza el sonido paralingüístico en la voz clonada, mezclándolo en el discurso circundante para que suene espontáneo en lugar de empalmar.

Chatterbox soporta 23 idiomas, incluyendo árabe, danés, alemán, griego, inglés, español, finlandés, francés, hebreo, hindi, italiano, japonés, coreano, malayo, holandés, noruego, polaco, portugués, ruso, sueco, swahili, turco y chino. Una sola voz clonada puede hablar en estos idiomas.

Chatterbox genera el habla rápidamente en una GPU, y la variante Turbo alcanza la latencia sub-200ms para el uso conversacional en tiempo real. La calidad es muy buena, con prosodia natural y reproducción de voz fiel desde clips de referencia incluso cortos.

Chatterbox necesita aproximadamente 4-8GB de VRAM dependiendo de la variante, con el modelo Turbo funcionando cómodamente en aproximadamente 4GB. En TextToSpeechAI no necesita ninguna GPU local - generación se ejecuta en nuestra infraestructura alojada.

Chatterbox es un motor de primer nivel que cuesta 25 créditos por cada 1.000 caracteres. Las nuevas cuentas obtienen 200 créditos gratis para probar la clonación de voz, y solo gastas créditos en el texto que realmente generas.

Ambos soportan la clonación de voz con cero disparos, pero Chatterbox cubre muchos más idiomas (23 vs 2) y añade etiquetas paralingüísticas expresivas. F5-TTS puede superar una prosodia inglesa ligeramente más natural, así que elija Chatterbox para clonar multilingüe y sonidos expresivos, y F5-TTS para la fidelidad en inglés.

Ambos ofrecen clonación de voz de alta calidad. Chatterbox admite 23 idiomas y etiquetas expresivas en línea, mientras que OpenVoice añade controles de estilo de tono (amistosos, tristes, enojados y más) que Chatterbox carece. Elija Chatterbox para una amplia cobertura de lenguaje y OpenVoice cuando necesite un estilo de tono emocional explícito.

Sí. Sign up for a free TextToSpeechAI account to receive 200 starter credits, or use the on-page demo to hear Chatterbox sin iniciar sesión. Sube un clip de referencia corto, escribe tu texto y genera una voz clonada en segundos.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Chatterbox Now

Generate your first audio free. No credit card required.

Start Free