MeloTTS

Standard

TTS rápido multi-acesso com prosodia natural

Very Fast Velocidade
Good Qualidade
Não Enchimento
6 Línguas

Sobre MeloTTS

MeloTTS é um modelo rápido de texto a voz multicedente da MyShell AI. Ele suporta múltiplas línguas com variações de acento autênticas para inglês (americano, inglês, indiano, australiano). MeloTTS funciona em tempo real na CPU, tornando-o eficiente para implantações de produção.

Características-chave

Multi-Accente

Múltiplos acentos ingleses: americano, britânico, indiano e australiano.

CPU em tempo real

O suficiente para a síntese em tempo real na CPU sem GPU.

6 Línguas

Apoia inglês, espanhol, francês, chinês, japonês e coreano.

Controlo de velocidade

Velocidade de fala ajustável para saída ajustada.

Casos de utilização

Aplicações de voz multi-acesso Localização internacional de conteúdo Assistentes de voz em tempo real Produção de audiolivros com variedade de accento

Como Utilizar MeloTTS

  1. 1

    Inscreva-se gratuitamente ou tente a demo

    Crie uma conta TextToSpeechAI gratuita para receber créditos de início ou use a demo de não assinatura na página inicial para testar o MeloTTS instantaneamente. Os créditos gratuitos são suficientes para avaliar vários acentos da MeloTTS antes de se entregar.

  2. 2

    Escolha um MeloTTS acento e voz

    Abra o navegador de voz e filtre para MeloTTS. Escolha o acento que se adapta ao seu público, como americano, britânico, indiano ou australiano inglês, ou uma voz nativa espanhola, francesa, chinesa, japonesa ou coreana.

  3. 3

    Insira o seu texto

    Digite ou cole o script que você quer voz na caixa de texto. MeloTTS maneja a prosódia natural automaticamente, e você pode ajustar a velocidade de fala para afinar o pacing para o seu acento escolhido.

  4. 4

    Gerar o áudio

    Clique em gerar e MeloTTS sintetiza sua fala em tempo real. Como ele funciona eficientemente na CPU, os resultados retornam rapidamente mesmo por passagens mais longas, e o emprego custa 10 créditos por 1.000 caracteres.

  5. 5

    Baixe ou use a API

    Reproduzir o resultado, então baixar o arquivo de áudio no seu formato preferido da página de histórico. Para automatizar o MeloTTS em seu próprio aplicativo, ligue para a API TextToSpeechAI REST em api.texttospeechai.com usando o token API da sua conta.

MeloTTS API

Gerar a fala programática usando a API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "MeloTTS fala naturalmente com autênticos acentos de todo o mundo.",
    "voice": "en_US-lessac-medium"
  }'

Perguntas Frequentes

MeloTTS é um modelo rápido de texto para voz da MyShell AI que se especializa em síntese de fala multi-ceito. Apoia múltiplos idiomas com várias variações de acento para o inglês, produzindo prósodia natural em tempo real.

Sim. A MeloTTS é liberada sob a licença MIT, abrangendo tanto o código como os pesos do modelo. Você pode usá-lo livremente em produtos comerciais sem royalties ou requisitos de atribuição.

O MeloTTS suporta os acentos americanos, britânicos, indianos e australianos. Inclui também vozes nativas para espanhol, francês, chinês, japonês e coreano, tornando-o bem adequado para aplicações internacionais.

A MeloTTS abrange seis línguas: inglês, espanhol, francês, chinês, japonês e coreano. As vozes inglesas adicionam autênticos acentos regionais no topo da língua base, por isso um modelo único manipula muitos mercados.

Sim. A MeloTTS é projetada para a síntese em tempo real e gera a fala mais rápido do que a reprodução mesmo na CPU. Isso torna-a um forte apto para assistentes de voz ao vivo, chatbots e aplicações de streaming.

MeloTTS produz boa fala de som natural com acessórios claros e precisos. Prioriza a velocidade e a variedade de acentuação sobre a fidelidade ultra-alta de modelos mais lentos como StyleTTS2 ou Tortoise, por isso é ideal quando a responsividade importa mais.

Não, MeloTTS não clona vozes. Usa um conjunto fixo de altofalantes e acentos predefinidos. Para clonar voz em TextToSpeechAI, use F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, ou Tortoise.

Não é necessário GPU. MeloTTS funciona confortavelmente na CPU usando cerca de 500MB de memória e permanece em tempo real. Uma GPU é opcional e só adiciona velocidade extra; cerca de 500MB de VRAM é suficiente se você optar por usar um.

MeloTTS é um motor de nível padrão em TextToSpeechAI, facturado em 10 créditos por 1.000 caracteres. É a menor nível de preços, combinando outros modelos de CPU leves como Piper, VITS e Kokoro.

Tanto MeloTTS como Kokoro são modelos de CPU rápidos, MIT/Apache-licenciados na nível de crédito padrão. Escolha MeloTTS quando você precisa de acentuações distintas do inglês (americano, britânico, indiano, australiano); escolha Kokoro para sua ampla variedade de voz multilingue. Ambos são fáceis de testar A/B em TextToSpeechAI.

A MeloTTS excelse na variedade de accentos e cobertura multilingue, enquanto a Piper oferece a maior biblioteca de voz predefinida. Ambos são rápidos e CPU-capáveis na nível padrão, então escolha a MeloTTS para projetos específicos de accento e Piper quando você quer a mais ampla seleção de vozes distintas.

Sim. Novas contas TextToSpeechAI incluem créditos de início livre, e há uma demo que você pode usar sem se inscrever. Isso é suficiente para testar os acentos e vozes MeloTTS antes de comprar créditos adicionais ou subscrição.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try MeloTTS Now

Generate your first audio free. No credit card required.

Start Free