Barre

Premium

Expressive AI Speech avec émotions et effets sonores

Slow Vitesse
Very Good Qualité
Numéro Clonage
13 Langues

À propos Barre

Bark est un modèle de texte à audio basé sur un transformateur qui peut générer des paroles très expressives avec des émotions, des rires, des soupirs et d'autres sons non verbaux. Contrairement au TTS traditionnel, Bark comprend le contexte et peut produire des paroles qui sonnent vraiment expressives et semblables à des humains.

Caractéristiques principales

Expression émotionnelle

Générer des paroles avec des rires, des soupirs, des gazps et des émotions authentiques.

Marqueurs d'émotion

Utilisez [rires], [soupirs], CAPS pour mettre l'accent, et... pour hésiter.

Multilingue

Supporte 13+ langues avec des accents naturels et prononciation.

Musique & Effets

Peut générer de la musique simple et des sons environnementaux.

Présets du Président

Plusieurs voix pré-formées avec différents styles.

Source ouverte

MIT sous licence avec plein droit d'utilisation commerciale.

Cas d'utilisation

Dialogue de caractère Contenu animé Narration de livres audio Jeu Voix agissant Projets créatifs Assistants expressifs

Barre Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Comment utiliser Barre

  1. 1

    Inscrivez-vous gratuitement et ouvrez la démo

    Créez un compte gratuit TextToSpeechAI pour réclamer vos crédits de démarrage, ou utilisez la démo sans signature pour essayer Bark tout de suite. Les crédits gratuits sont suffisants pour générer plusieurs clips Bark expressifs avant de mettre à jour.

  2. 2

    Choisissez une voix barque

    Ouvrez la bibliothèque vocale et sélectionnez un haut-parleur Bark qui correspond au ton que vous voulez. Les voix Bark sont étiquetées comme le niveau premium (25 crédits par 1000 caractères) et sont adaptées pour la narration émotionnelle et de style personnage.

  3. 3

    Entrez le texte avec des marqueurs d'émotion

    Tapez votre script et intégrez les marqueurs d'émotion Bark en ligne : [rires] pour rire, [soupires] pour soupirs, [gouttes] pour gaspilles,... pour une pause, et CAPS pour mettre l'accent. Par exemple : « Oh wow! [rires] C'est AMAZING... Je n'arrive pas à le croire! »

  4. 4

    Générer l'audio

    Cliquez sur Générer et Bark rend votre texte en expression, en transformant chaque marqueur en son correspondant. Générer est plus lent que les moteurs légers en raison du modèle de transformateur de Bark, donc laissez quelques secondes supplémentaires par phrase.

  5. 5

    Télécharger ou utiliser l'API

    Prévisualiser le résultat, puis le télécharger en MP3, WAV, ou OGG. Pour automatiser Bark dans votre propre application, appelez l'API TextToSpeechAI avec une voix Bark et le même texte riche en marqueurs pour récupérer l'audio expressif.

Barre API

Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Oh wow! [rires] C\u0027est incroyable... J\u0027AMOURAIS juste à quel point cela sonne expressif!",
    "voice": "bark-zh_0"
  }'

Foire aux questions

Bark est un modèle de texte à audio créé par Suno. Contrairement aux systèmes TTS traditionnels, Bark génère des paroles très expressives avec des émotions naturelles, des rires, des soupirs et d'autres sons non verbaux. Il peut même générer de la musique et des effets sonores.

Oui, Bark est open-source sous licence MIT, permettant une utilisation commerciale gratuite. Sur TextToSpeechAI, nous facturons 25 crédits par 1000 caractères en raison des ressources importantes GPU nécessaires pour la génération.

Bark prend en charge 13+ langues dont l'anglais, l'allemand, l'espagnol, le français, le hindi, l'italien, le japonais, le coréen, le polonais, le portugais, le russe, le turc et le chinois.

Bark est plus lent que la plupart des moteurs TTS en raison de son architecture de transformateur autorégressive. Une phrase typique prend 5-15 secondes pour générer sur GPU. L'échange est significativement plus expressif et naturel.

Bark offre seulement un clonage vocal limité par des « prompts sémantiques » et des préréglages haut-parleurs, de sorte qu'il ne peut pas cloner de façon fiable une voix arbitraire d'un échantillon. Si le clonage vocal complet est votre objectif, utilisez F5-TTS, StyleTTS2, OpenVoice, ou Tortoise au lieu, tous disponibles sur TextToSpeechAI.

Bark lit des marqueurs en ligne placés directement dans votre texte et les transforme en sons correspondants. Utilisez [rires] pour rire, [soupires] pour soupirer, [gaspillements] pour gaspiller,... pour hésiter ou faire une pause, et CAPS pour mettre l'accent. Exemple : « Oh wow! [rires] C'est hallucinant... Je n'arrive pas à le croire! »

Au-delà de la parole simple, Bark peut produire des sons non verbaux comme le rire, les soupirs, les gaspilles, la clairance de la gorge et les bégaiements, ainsi que de la musique simple et des effets environnementaux.

Bark produit un son de très bonne qualité avec une expression naturelle qui rivalise avec la parole humaine pour le contenu émotionnel. La sortie 24kHz sonne professionnel, bien que la qualité de la parole pure soit légèrement inférieure à StyleTTS2.

Bark nécessite 8-12 Go de VRAM en fonction de la taille du modèle. Le modèle complet a besoin ~12 Go, tandis que les variantes plus petites fonctionnent avec 8 Go. Inférence CPU est extrêmement lente et pas recommandée.

Oui, Bark est sous licence MIT, ce qui permet une utilisation commerciale sans restriction sans frais de licence. Vous pouvez utiliser Bark dans les produits, services et applications gratuitement. Sur TextToSpeechAI, vous pouvez essayer gratuitement Bark en utilisant vos crédits d'inscription avant de payer pour plus.

Bark excelle dans un discours expressif à un seul haut-parleur avec des marqueurs d'émotion comme [rires] et [soupirs], tandis que Dia est construit pour le dialogue multi-parleurs avec [S1]/[S2] tours et des repères non verbaux. Choisissez Bark pour la narration émotionnelle et la voix de caractère, et Dia pour les conversations de retour et de retour. Les deux sont disponibles sur TextToSpeechAI.

Bark est unique dans sa capacité à générer une parole véritablement expressive avec des émotions et des sons non verbaux. Il est plus lent que d'autres moteurs mais produit des résultats plus humains pour le contenu créatif. Pour une synthèse plus rapide, utilisez Piper. Pour le clonage vocal, utilisez F5-TTS ou OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Barre Now

Generate your first audio free. No credit card required.

Start Free