Parler-TTS

Premium

Geração de Voz Descrita por Texto

Moderate Velocidade
Very Good Qualidade
Não Enchimento
1 Línguas

Sobre Parler-TTS

O Parler-TTS é um modelo único de texto para voz que gera vozes baseadas em descrições de texto. Em vez de selecionar vozes pré-definidas, você descreve a voz que você quer: "Uma jovem fala claramente com um acento americano" ou "Um homem idoso britânico fala lentamente em voz profunda." O Parler-TTS gera então fala que corresponda à sua descrição.

Características-chave

Descrições do texto

Gerar vozes descrevendo as características desejadas.

Controlo Criativo

Especificar idade, gênero, accento, velocidade e estilo de fala.

Vozes Únicas

Criar vozes que não existam em bibliotecas pré-made.

Produção natural

Gera fala de alta qualidade, sonora natural.

Eficiência

Inferência rápida para geração de voz descrita.

Fonte Aberta

Apache 2.0 licenciado para uso comercial.

Casos de utilização

Desenho de Voz de Personagens Projetos Criativos Prototipo Voiceovers Desenvolvimento de Jogo Caracteres do audiobook Criação de Voz Personalizada

Parler-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Como Utilizar Parler-TTS

  1. 1

    Inscreva-se gratuitamente ou tente a demo

    Crie uma conta TextToSpeechAI gratuita para 200 créditos de arranque, ou abra a demo para tentar o Parler-TTS instantaneamente sem se inscrever.

  2. 2

    Selecione o Parler-TTS e escreva uma descrição de voz

    Escolha Parler-TTS como seu motor, então escreva uma descrição de voz de texto simples como "Uma jovem fala claramente com um acento americano." Inclua idade, gênero, acento, ritmo e humor para formar a voz.

  3. 3

    Escreva o texto para falar

    Digite ou cole o script que deseja. O Parler-TTS torna este texto na voz definida pela sua descrição, então mantenha a descrição e o script na mesma língua (inglês funciona melhor).

  4. 4

    Gere a fala

    Clique em gerar para enviar o trabalho para o nosso backend GPU. Parler-TTS sintetiza áudio natural que corresponda à sua voz descrita, facturada na nível Premium de 25 créditos por 1000 caracteres.

  5. 5

    Baixe ou ligue para a API

    Baixe o áudio acabado como MP3, WAV, ou OGG, ou automatize a geração através da API TextToSpeechAI passando o texto e salvou a descrição de voz em cada pedido.

Parler-TTS API

Gerar a fala programática usando a API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Uma jovem alegre fala com um acento americano.",
    "voice": "parler-female_american"
  }'

Perguntas Frequentes

O Parler-TTS é um modelo de texto para voz que gera vozes a partir de descrições de texto. Em vez de escolher vozes pré-fabricadas, você descreve o que você quer: "Uma mulher calma, madura com um acento australiano falando a um ritmo moderado."

O Parler-TTS é open-source sob a licença Apache 2.0. Em TextToSpeechAI, cobramos 25 créditos por 1000 caracteres (Nível de prémio) por suas capacidades únicas de geração de voz.

O Parler-TTS suporta principalmente o inglês. As descrições de voz funcionam melhor em inglês, embora o modelo possa lidar com vários acentos ingleses (americanos, britânicos, australianos, etc.).

Descreva as características da voz naturalmente: "Uma jovem fala claramente com um acento britânico" ou "Um homem idoso com uma voz profunda fala lentamente e cuidadosamente." Inclua idade, gênero, acento, velocidade e humor.

O Parler-TTS tem velocidade de geração moderada, tipicamente 2-5 segundos por frase na GPU. O processamento da descrição vocal adiciona overhead mínimo em comparação com a geração real da fala.

Não, o Parler-TTS gera vozes a partir de descrições e não de clonar vozes existentes. Para clonagem de voz, use StyleTTS2, F5-TTS, OpenVoice ou Tortoise.

O Parler-TTS requer 4-8GB de VRAM dependendo do tamanho do modelo. A versão mini funciona com 4GB, enquanto o modelo completo beneficia de 8GB para o desempenho óptimo.

Sim, o Parler-TTS é licenciado para Apache 2.0 e suporta uso comercial. Como as vozes são geradas a partir de descrições, não há preocupações de propriedade de voz.

Inclua a sua descrição de voz no pedido API junto com o seu texto. Nossa API processa a descrição e gera fala correspondente. Você pode salvar descrições favoritas para reutilização.

Parler-TTS produz áudio muito bom e natural com prosodia que corresponde à sua voz descrita. Ele produz WAV nativamente, e em TextToSpeechAI você pode download-lo como MP3, WAV, ou OGG com conversão automática.

Ambos são motores expressivos, de código aberto, mas diferem no controle. O Parler-TTS permite dirigir a voz com uma descrição de texto simples (idade, acento, ritmo, humor), enquanto Bark adiciona sinais não verbais como [riacha] e música. Escolha o Parler-TTS quando você quer uma voz específica descrita e o Bark quando você quer entrega emocional espontânea.

Sim. Inscreva-se para uma conta gratuita em TextToSpeechAI para receber 200 créditos de início, ou use a demo para ouvir o Parler-TTS sem uma conta. Isso é suficiente para testar várias descrições de voz antes de escolher um pacote de crédito.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Parler-TTS Now

Generate your first audio free. No credit card required.

Start Free