Ouvrir la voix

Ultra

Clonage instantané de la voix avec contrôle de tonalité granulaire

Moderate Vitesse
Very Good Qualité
Oui Clonage
10 Langues

À propos Ouvrir la voix

OpenVoice est un modèle de clonage de voix instantanée polyvalent qui permet un contrôle fin sur le style de parole. Contrairement à d'autres modèles de clonage, OpenVoice sépare l'identité vocale du style de parole, vous permettant de prendre une voix clonée et appliquer différentes tonalités - gaie, triste, en colère, excitée, ou murmurant - sans nouvelle audio de référence.

Caractéristiques principales

Clonage instantané

Clone n'importe quelle voix à partir de quelques secondes d'audio.

Contrôle des tons

Appliquez des tons joyeux, tristes, en colère, excités ou murmurez.

Transfert de style

Une identité vocale séparée du style de parole pour la flexibilité.

Le nombre de personnes ayant un emploi dans le secteur de la santé est de 1 % en moyenne.

Utilisez des voix clonées dans différentes langues.

Traitement rapide

Inférence efficace pour la génération rapide de la voix.

Source ouverte

MIT agréé pour les applications commerciales.

Cas d'utilisation

Contenu émotionnel Animation de caractères Jeux interactifs Narration de livres audio Vidéos de marketing Assistants virtuels

Comment utiliser Ouvrir la voix

  1. 1

    Inscrivez-vous gratuitement ou essayez la démo

    Créez un compte gratuit TextToSpeechAI pour obtenir des crédits de démarrage, ou utilisez la démo sur la page pour entendre OpenVoice avant de commettre. Pas de GPU ou d'installation locale est nécessaire - tout fonctionne sur nos serveurs.

  2. 2

    Choisissez OpenVoice et téléchargez un clip de référence

    Sélectionnez le moteur OpenVoice, puis téléchargez quelques secondes d'audio de référence propre pour cloner instantanément la voix cible. OpenVoice capture l'identité de l'enceinte afin que vous puissiez la réutiliser sur n'importe quel texte et ton.

  3. 3

    Saisissez votre texte

    Tapez ou collez le script que vous voulez parler dans la voix clonée. OpenVoice prend en charge environ 10 langues et la livraison cross-lingual, de sorte que vous pouvez écrire dans une langue différente de celle du clip de référence.

  4. 4

    Choisissez un style de ton et générer

    Choisissez l'un des neuf styles de ton OpenVoice - par défaut, amical, joyeux, excité, triste, en colère, terrifié, criant ou murmurant - puis générer. La même voix clonée parlera avec cette livraison émotionnelle.

  5. 5

    Télécharger ou utiliser l'API

    Téléchargez votre audio en MP3, WAV ou OGG, ou automatisez la génération à travers l'API TextToSpeechAI en passant votre style voix et tons clonés dans chaque requête.

Ouvrir la voix API

Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice peut parler de n\u0027importe quel ton \u002D joyeux, triste, ou même murmurer.",
    "voice": "en_US-lessac-medium"
  }'

Foire aux questions

OpenVoice est un modèle avancé de clonage de texte à voix et de voix qui sépare l'identité vocale de la parole. Cela vous permet de cloner une voix et d'appliquer ensuite différentes tonalités émotionnelles sans avoir besoin de nouvelles références audio pour chaque émotion. Il est construit pour la génération expressive et contrôlable de la parole.

Oui, OpenVoice effectue le clonage de la voix instantanée à partir de quelques secondes de son de référence - aucun entraînement requis. Une fois qu'une voix est capturée, OpenVoice peut réutiliser cette identité sur n'importe quel texte et n'importe quel style de ton que vous sélectionnez.

OpenVoice utilise une architecture en deux étapes qui divise la synthèse de la parole de base de la conversion de ton. Après avoir clonage une voix, vous pouvez appliquer l'un des 9 styles de ton - par défaut, amical, joyeux, excité, triste, en colère, terrifié, criant, ou murmurant - et la même voix clonée parle différemment selon votre ton choisi sans ré-enregistrer.

OpenVoice prend en charge neuf styles de parole : par défaut, amical, joyeux, excité, triste, en colère, terrifié, criant et murmurant. Chaque style remodele la livraison émotionnelle tout en préservant l'identité de l'enceinte clonée, vous donnant un contrôle fin sur la façon dont une ligne est lue.

OpenVoice est open-source sous licence MIT permissive, donc il est gratuit pour une utilisation commerciale. Comme avec tout modèle de clonage, assurez-vous que vous avez les droits appropriés à toute voix que vous clonez pour des projets commerciaux.

OpenVoice prend en charge une dizaine de langues, dont l'anglais, le chinois, le japonais, le coréen et plusieurs langues européennes. Il offre également le clonage translingue, de sorte que vous pouvez cloner une voix dans une langue et la faire parler naturellement dans une autre.

OpenVoice a une vitesse de génération modérée, rendant généralement une phrase en 2-4 secondes sur un GPU. La qualité de sortie est très bonne, avec une reproduction vocale claire et un transfert de ton qui maintient l'identité de l'enceinte intacte tout en changeant de manière convaincante la livraison émotionnelle.

OpenVoice nécessite généralement 6-8 Go de VRAM en fonction de la taille du lot et de la charge de conversion de ton. Il fonctionne confortablement sur les GPU de moyenne portée à haute portée, et sur TextToSpeechAI tout cela est géré sur nos serveurs afin que vous n'ayez pas besoin de matériel local.

OpenVoice est un moteur ultra-tier, à prix de 50 crédits par 1000 caractères. Le niveau Ultra reflète son contrôle de ton avancé et le calcul supplémentaire nécessaire pour le pipeline de clonage plus style-conversion.

OpenVoice est unique pour son ton et son style : vous pouvez prendre une voix clonée et la re-livrer comme gaie, triste, en colère, ou murmurant. F5-TTS est plus rapide et est notre moteur de clonage par défaut pour la parole naturelle et neutre. Choisissez OpenVoice quand vous avez besoin de contrôle de style émotionnel, et F5-TTS quand vous voulez le clone naturel le plus rapide.

Créez une voix clonée en téléchargeant l'audio de référence, puis spécifiez un style de ton dans votre demande d'API. L'API applique automatiquement votre ton émotionnel choisi à la voix clonée et retourne l'audio au format MP3, WAV ou OGG.

Oui. Inscrivez-vous pour un compte gratuit TextToSpeechAI pour recevoir des crédits de démarrage et essayez OpenVoice clonage et contrôle de ton, ou utilisez la démo sur la page d'abord. Il n'y a pas de configuration locale - télécharger un clip de référence, choisir un ton, et générer dans le navigateur.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try Ouvrir la voix Now

Generate your first audio free. No credit card required.

Start Free