Parler-TTS

Premium

Generación de voz descrita por texto

Moderate Velocidad
Very Good Calidad
No Clonación
1 Idiomas

Acerca de Parler-TTS

Parler-TTS es un modelo único de texto a voz que genera voces basadas en descripciones de texto.En lugar de seleccionar entre voces predefinidas, describes la voz que quieres: "Una mujer joven habla claramente con un acento americano" o "Un anciano británico habla lentamente con una voz profunda". Parler-TTS entonces genera un discurso que coincide con tu descripción.

Características principales

Descripciones de texto

Generar voces describiendo las características deseadas.

Control creativo

Especifique edad, sexo, acento, velocidad y estilo de hablar.

Voces únicas

Cree voces que no existen en bibliotecas prefabricadas.

Producción natural

Genera un discurso de alta calidad y sonido natural.

Eficiente

Inferencia rápida para la generación de voz descrita.

Código abierto

Apache 2.0 con licencia de uso comercial.

Casos de uso

Diseño de voz de caracteres Proyectos creativos Prototipo de voz en offs Desarrollo de juegos Caracteres de audiolibro Creación personalizada de voz

Parler-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Cómo usar Parler-TTS

  1. 1

    Regístrate gratis o prueba la demo

    Cree una cuenta gratuita TextToSpeechAI para 200 créditos de inicio, o abra la demo para probar Parler-TTS al instante sin registrarse.

  2. 2

    Seleccione Parler-TTS y escriba una descripción de voz

    Elija Parler-TTS como su motor, luego escriba una descripción de voz de texto plano como "Una mujer joven habla claramente con un acento americano".Incluya edad, género, acento, ritmo y estado de ánimo para dar forma a la voz.

  3. 3

    Introduzca el texto para hablar

    Escriba o pegue el script que desee. Parler-TTS renderiza este texto en la voz definida por su descripción, así que mantenga la descripción y el script en el mismo idioma (el inglés funciona mejor).

  4. 4

    Generar el discurso

    Haga clic en generar para enviar el trabajo a nuestro motor de GPU. Parler-TTS sintetiza el sonido natural de audio que coincide con su voz descrita, facturado en el nivel Premium de 25 créditos por 1000 caracteres.

  5. 5

    Descargue o llame a la API

    Descargue el audio terminado como MP3, WAV o OGG, o automatice la generación a través de la API TextToSpeechAI pasando su texto y la descripción de voz guardada en cada solicitud.

Parler-TTS API

Generar voz programáticamente usando la API de TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Una joven alegre habla con acento americano.",
    "voice": "parler-female_american"
  }'

Preguntas frecuentes

Parler-TTS es un modelo de texto a voz que genera voces a partir de descripciones de texto.En lugar de elegir voces prefabricadas, describes lo que quieres: "Una mujer tranquila y madura con acento australiano que habla a un ritmo moderado".

Parler-TTS es de código abierto bajo licencia Apache 2.0. En TextToSpeechAI, cobramos 25 créditos por cada 1000 caracteres (nivel Premium) por sus capacidades únicas de generación de voz.

Parler-TTS soporta principalmente el inglés. Las descripciones de voz funcionan mejor en inglés, aunque el modelo puede manejar varios acentos ingleses (estadounidenses, británicos, australianos, etc.).

Describa las características de la voz de forma natural: "Una joven habla claramente con acento británico" o "Un anciano con voz profunda habla lenta y cuidadosamente".Incluya edad, género, acento, velocidad y estado de ánimo.

Parler-TTS tiene una velocidad de generación moderada, normalmente de 2 a 5 segundos por frase en la GPU. El procesamiento de descripción de voz añade un mínimo de gastos en comparación con la generación de voz real.

No, Parler-TTS genera voces a partir de descripciones en lugar de clonar voces existentes.Para la clonación de voz, utilice StyleTTS2, F5-TTS, OpenVoice o Tortoise.

Parler-TTS requiere 4-8GB de VRAM dependiendo del tamaño del modelo. La versión mini funciona con 4GB, mientras que el modelo completo se beneficia de 8GB para un rendimiento óptimo.

Sí, Parler-TTS tiene licencia Apache 2.0 y admite el uso comercial. Dado que las voces se generan a partir de descripciones, no hay preocupaciones de propiedad de la voz.

Incluya su descripción de voz en la solicitud de API junto con su texto. Nuestra API procesa la descripción y genera el discurso correspondiente. Puede guardar las descripciones favoritas para su reutilización.

Parler-TTS produce un sonido muy bueno y natural con una prosodia que coincide con tu voz descrita. Sale WAV de forma nativa, y en TextToSpeechAI puedes descargarlo como MP3, WAV o OGG con conversión automática.

Ambos son motores expresivos de código abierto, pero difieren en el control. Parler-TTS te permite dirigir la voz con una descripción de texto plano (edad, acento, ritmo, estado de ánimo), mientras que Bark añade señales no verbales como [risas] y música. Elige Parler-TTS cuando quieras una voz específica y Bark cuando quieras una entrega emocional espontánea.

Sí. Regístrese para una cuenta gratuita en TextToSpeechAI para recibir 200 créditos de inicio, o utilice la demo para escuchar Parler-TTS sin una cuenta. Eso es suficiente para probar varias descripciones de voz antes de elegir un paquete de crédito.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Parler-TTS Now

Generate your first audio free. No credit card required.

Start Free