MeloTTS

Standard

TTS rápido multiactivo con prosodia natural

Very Fast Velocidad
Good Calidad
No Clonación
6 Idiomas

Acerca de MeloTTS

MeloTTS es un modelo de texto a voz rápido y multiactivo de MyShell AI. Soporta múltiples idiomas con variaciones de acento auténticas para inglés (estadounidense, británico, indio, australiano). MeloTTS funciona a velocidad en tiempo real en la CPU, lo que lo hace eficiente para despliegues de producción.

Características principales

Múltiples

Múltiples acentos ingleses: americanos, británicos, indios y australianos.

CPU en tiempo real

Lo suficientemente rápido para la síntesis en tiempo real en la CPU sin GPU.

6 Idiomas

Soporta inglés, español, francés, chino, japonés y coreano.

Control de velocidad

Velocidad de habla ajustable para una salida afinada.

Casos de uso

Aplicaciones de voz multiactas Localización de contenidos internacionales Asistentes de voz en tiempo real Producción de audiolibros con variedad de acento

Cómo usar MeloTTS

  1. 1

    Regístrate gratis o prueba la demo

    Cree una cuenta gratuita TextToSpeechAI para recibir créditos de inicio, o utilice la demo sin registro en la página de inicio para probar MeloTTS al instante. Los créditos gratuitos son suficientes para evaluar varios acentos MeloTTS antes de comprometerse.

  2. 2

    Elige un acento y una voz MeloTTS

    Abre el navegador de voz y filtra a MeloTTS. Elige el acento que se adapte a tu audiencia, como inglés americano, británico, indio o australiano, o una voz nativa en español, francés, chino, japonés o coreano.

  3. 3

    Introduzca su texto

    Escriba o pegue el script que desea expresar en el cuadro de texto. MeloTTS maneja la prosodia natural automáticamente, y puede ajustar la velocidad de habla para ajustar el ritmo para su acento elegido.

  4. 4

    Generar el audio

    Haga clic en generar y MeloTTS sintetiza su discurso en tiempo real. Debido a que funciona eficientemente en la CPU, los resultados vuelven rápidamente incluso para pasajes más largos, y el trabajo cuesta 10 créditos por cada 1.000 caracteres.

  5. 5

    Descargue o utilice la API

    Reproduce el resultado y luego descarga el archivo de audio en tu formato preferido desde la página del historial. Para automatizar MeloTTS en tu propia aplicación, llama a la API de TextToSpeechAI REST en api.texttospeechai.com usando el token API de tu cuenta.

MeloTTS API

Generar voz programáticamente usando la API de TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "MeloTTS habla naturalmente con acentos auténticos de todo el mundo.",
    "voice": "en_US-lessac-medium"
  }'

Preguntas frecuentes

MeloTTS es un modelo rápido de texto a voz de MyShell AI que se especializa en síntesis de habla multiactivo. Soporta varios idiomas con varias variaciones de acento para el inglés, produciendo prosodia natural a velocidad en tiempo real.

Sí. MeloTTS se libera bajo la licencia MIT, que cubre tanto el código como los pesos del modelo. Puede usarlo libremente en productos comerciales sin regalías ni requisitos de atribución.

MeloTTS apoya los acentos americanos, británicos, indios y australianos. También incluye voces nativas para español, francés, chino, japonés y coreano, lo que lo hace muy adecuado para aplicaciones internacionales.

MeloTTS cubre seis idiomas: inglés, español, francés, chino, japonés y coreano. Las voces inglesas añaden acentos regionales auténticos en la parte superior de la lengua base, por lo que un solo modelo maneja muchos mercados.

Sí. MeloTTS está diseñado para la síntesis en tiempo real y genera voz más rápido que la reproducción incluso en la CPU. Esto lo hace un fuerte ajuste para asistentes de voz en vivo, chatbots y aplicaciones de streaming.

MeloTTS produce un buen sonido natural con acentos claros de prosodia y precisión. Prioriza la variedad de velocidad y acento sobre la ultra alta fidelidad de modelos más lentos como StyleTTS2 o Tortoise, por lo que es ideal cuando más importa la capacidad de respuesta.

No, MeloTTS no clona voces. Utiliza un conjunto fijo de altavoces y acentos preestablecidos. Para la clonación de voz en TextToSpeechAI, utilice F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, o Tortoise en su lugar.

No se requiere GPU. MeloTTS funciona cómodamente en la CPU utilizando aproximadamente 500 MB de memoria y permanece en tiempo real. Una GPU es opcional y sólo añade velocidad adicional; alrededor de 500 MB de VRAM es suficiente si usted elige utilizar uno.

MeloTTS es un motor de nivel estándar en TextToSpeechAI, facturado a 10 créditos por cada 1.000 caracteres. Ese es el nivel de precios más bajo, emparejando otros modelos de CPU ligeros como Piper, VITS y Kokoro.

Tanto MeloTTS como Kokoro son modelos de CPU rápidos con licencia MIT/Apache en el nivel de crédito estándar. Elija MeloTTS cuando necesite acentos ingleses distintos (estadounidense, británico, indio, australiano); elija Kokoro por su amplia variedad de voz multilingüe. Ambos son fáciles de probar A/B en TextToSpeechAI.

MeloTTS destaca en la variedad de acento y cobertura multilingüe, mientras que Piper ofrece la mayor biblioteca de voz preestablecida. Ambos son rápidos y capaces de CPU en el nivel estándar, por lo que elija MeloTTS para proyectos específicos de acento y Piper cuando desee la más amplia selección de voces distintas.

Sí. Las nuevas cuentas TextToSpeechAI incluyen créditos de inicio gratuitos, y hay una demo que puedes usar sin registrarte. Eso es suficiente para probar los acentos y voces de MeloTTS antes de comprar créditos adicionales o suscribirse.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try MeloTTS Now

Generate your first audio free. No credit card required.

Start Free