Ouvrir la voix
UltraClonage instantané de la voix avec contrôle de tonalité granulaire
À propos Ouvrir la voix
OpenVoice est un modèle de clonage de voix instantanée polyvalent qui permet un contrôle fin sur le style de parole. Contrairement à d'autres modèles de clonage, OpenVoice sépare l'identité vocale du style de parole, vous permettant de prendre une voix clonée et appliquer différentes tonalités - gaie, triste, en colère, excitée, ou murmurant - sans nouvelle audio de référence.
Caractéristiques principales
Clonage instantané
Clone n'importe quelle voix à partir de quelques secondes d'audio.
Contrôle des tons
Appliquez des tons joyeux, tristes, en colère, excités ou murmurez.
Transfert de style
Une identité vocale séparée du style de parole pour la flexibilité.
Le nombre de personnes ayant un emploi dans le secteur de la santé est de 1 % en moyenne.
Utilisez des voix clonées dans différentes langues.
Traitement rapide
Inférence efficace pour la génération rapide de la voix.
Source ouverte
MIT agréé pour les applications commerciales.
Cas d'utilisation
Comment utiliser Ouvrir la voix
-
1
Inscrivez-vous gratuitement ou essayez la démo
Créez un compte gratuit TextToSpeechAI pour obtenir des crédits de démarrage, ou utilisez la démo sur la page pour entendre OpenVoice avant de commettre. Pas de GPU ou d'installation locale est nécessaire - tout fonctionne sur nos serveurs.
-
2
Choisissez OpenVoice et téléchargez un clip de référence
Sélectionnez le moteur OpenVoice, puis téléchargez quelques secondes d'audio de référence propre pour cloner instantanément la voix cible. OpenVoice capture l'identité de l'enceinte afin que vous puissiez la réutiliser sur n'importe quel texte et ton.
-
3
Saisissez votre texte
Tapez ou collez le script que vous voulez parler dans la voix clonée. OpenVoice prend en charge environ 10 langues et la livraison cross-lingual, de sorte que vous pouvez écrire dans une langue différente de celle du clip de référence.
-
4
Choisissez un style de ton et générer
Choisissez l'un des neuf styles de ton OpenVoice - par défaut, amical, joyeux, excité, triste, en colère, terrifié, criant ou murmurant - puis générer. La même voix clonée parlera avec cette livraison émotionnelle.
-
5
Télécharger ou utiliser l'API
Téléchargez votre audio en MP3, WAV ou OGG, ou automatisez la génération à travers l'API TextToSpeechAI en passant votre style voix et tons clonés dans chaque requête.
Ouvrir la voix API
Générer des discours programmatiques en utilisant l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "OpenVoice peut parler de n\u0027importe quel ton \u002D joyeux, triste, ou même murmurer.",
"voice": "en_US-lessac-medium"
}'
Foire aux questions
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50