Parler-TTS

Premium

Génération de voix décrite par texte

Moderate Vitesse
Very Good Qualité
Numéro Clonage
1 Langues

À propos Parler-TTS

Parler-TTS est un modèle unique de texte à texte qui génère des voix basées sur des descriptions de texte. Au lieu de sélectionner à partir de voix prédéfinies, vous décrivez la voix que vous voulez : « Une jeune femme parle clairement avec un accent américain » ou « Un homme britannique âgé parle lentement d'une voix profonde ».

Caractéristiques principales

Descriptions du texte

Générer des voix en décrivant les caractéristiques souhaitées.

Contrôle créatif

Précisez l'âge, le sexe, l'accent, la vitesse et le style de parole.

Voix uniques

Créez des voix qui n'existent pas dans les bibliothèques pré-made.

Produit naturel

Génére un discours de haute qualité et naturel.

Efficacité

Inférence rapide pour la génération de voix décrite.

Source ouverte

Apache 2.0 sous licence pour une utilisation commerciale.

Cas d'utilisation

Conception vocale de caractères Projets créatifs Prototype de voix-overs Développement de jeux Caractères de livres audio Création vocale personnalisée

Parler-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Comment utiliser Parler-TTS

  1. 1

    Inscrivez-vous gratuitement ou essayez la démo

    Créez un compte gratuit TextToSpeechAI pour 200 crédits de démarrage, ou ouvrez la démo pour essayer Parler-TTS instantanément sans vous inscrire.

  2. 2

    Sélectionnez Parler-TTS et écrivez une description vocale

    Choisissez Parler-TTS comme moteur, puis écrivez une description de la voix en texte simple comme « Une jeune femme parle clairement avec un accent américain. » Inclure l'âge, le sexe, l'accent, le rythme et l'humeur pour façonner la voix.

  3. 3

    Saisissez le texte pour parler

    Tapez ou collez le script que vous voulez parler. Parler-TTS rend ce texte dans la voix définie par votre description, donc gardez la description et le script dans la même langue (anglais fonctionne mieux).

  4. 4

    Générer le discours

    Cliquez sur générer pour envoyer le travail à notre moteur GPU. Parler-TTS synthétise un son naturel correspondant à votre voix décrite, facturé au niveau Premium de 25 crédits par 1000 caractères.

  5. 5

    Télécharger ou appeler l'API

    Téléchargez l'audio fini en MP3, WAV ou OGG, ou automatisez la génération à travers l'API TextToSpeechAI en passant votre texte et la description vocale enregistrée dans chaque requête.

Parler-TTS API

Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Une jeune femme joyeuse parle avec un accent américain.",
    "voice": "parler-female_american"
  }'

Foire aux questions

Parler-TTS est un modèle de texte à texte qui génère des voix à partir de descriptions de texte. Au lieu de choisir des voix pré-faites, vous décrivez ce que vous voulez : « Une femme calme et mature avec un accent australien parlant à un rythme modéré. »

Parler-TTS est open-source sous licence Apache 2.0. Sur TextToSpeechAI, nous facturons 25 crédits par 1000 caractères (niveau Premium) pour ses capacités uniques de génération vocale.

Parler-TTS prend principalement en charge l'anglais. Les descriptions vocales fonctionnent mieux en anglais, bien que le modèle peut gérer divers accents anglais (américain, britannique, australien, etc.).

Décrivez naturellement les caractéristiques de la voix : « Une jeune femme parle clairement avec un accent britannique » ou « Un homme âgé avec une voix profonde parle lentement et soigneusement ».

Parler-TTS a une vitesse de génération modérée, généralement 2-5 secondes par phrase sur GPU. Le traitement de la description vocale ajoute un minimum de frais généraux par rapport à la génération de la parole réelle.

Non, Parler-TTS génère des voix à partir de descriptions plutôt que de clonage de voix existantes. Pour le clonage de voix, utilisez StyleTTS2, F5-TTS, OpenVoice ou Tortoise.

Parler-TTS nécessite 4-8 Go de VRAM en fonction de la taille du modèle. La version mini fonctionne avec 4 Go, tandis que le modèle complet bénéficie de 8 Go pour une performance optimale.

Oui, Parler-TTS est sous licence Apache 2.0 et supporte l'utilisation commerciale. Puisque les voix sont générées à partir de descriptions, il n'y a pas de problème de propriété vocale.

Inclure votre description vocale dans la requête API avec votre texte. Notre API traite la description et génère des mots correspondants. Vous pouvez enregistrer les descriptions préférées pour la réutilisation.

Parler-TTS produit un son très bon et naturel avec une prosody qui correspond à votre voix décrite. Il produit WAV nativement, et sur TextToSpeechAI vous pouvez le télécharger sous la forme de MP3, WAV ou OGG avec conversion automatique.

Les deux sont des moteurs expressifs, open source, mais ils diffèrent en contrôle. Parler-TTS vous permet de diriger la voix avec une description en texte simple (âge, accent, rythme, humeur), tandis que Bark ajoute des signaux non verbaux comme [rire] et de la musique. Choisissez Parler-TTS lorsque vous voulez une voix décrite spécifique et Bark lorsque vous voulez une livraison émotionnelle spontanée.

Oui. Inscrivez-vous à un compte gratuit sur TextToSpeechAI pour recevoir 200 crédits de démarrage, ou utilisez la démo pour entendre Parler-TTS sans compte. Cela suffit pour tester plusieurs descriptions vocales avant de choisir un pack de crédit.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Parler-TTS Now

Generate your first audio free. No credit card required.

Start Free