Σχετικά ΒΙΤΣ
VITS (Variational Conference with adversarial learning for end-to-end Text-to-Speech) is a fast, end-to-end neural TTS model that creasing natural-sounding speech. It combines varitional autoencoders with adversarial training for efficient composition. VITS is excellent for batch processing and applications required both as quality and speed.
Βασικά χαρακτηριστικά
Γρήγορη σύνθεση
Τέρμα-to-end αρχιτεκτονική για την παραγωγή ταχείας ομιλίας.
Επεξεργασία παρτίδας
Αποτελεσματικά επεξεργάζεται πολλαπλά κείμενα ταυτόχρονα.
Φυσική Ομιλία
Η εκπαίδευση VAE+GAN παράγει φυσική προσθετικότητα και ρυθμό.
Multi-Speaker
Μονό μοντέλο υποστηρίζει πολλαπλές φωνές ηχείων.
Αποτελεσματικό
Χαμηλό αποτύπωμα μνήμης με καλή απόδοση.
Άνοιγμα πηγής
MIT άδεια για οποιαδήποτε περίπτωση χρήσης.
Υpiοθέσει χρήση
ΒΙΤΣ Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENΠώς να χρησιμοποιήσετε το φάρμακο ΒΙΤΣ
-
1
Εγγραφείτε δωρεάν ή δοκιμάστε το demo
Δημιουργήστε ένα δωρεάν λογαριασμό TextToSpeechAI για να πάρετε μονάδες εκκίνησης, ή χρησιμοποιήστε το demo on-page για να ακούσετε VITS πριν εγγραφείτε.
-
2
Επιλέξτε μια φωνή ή ένα ηχείο VITS
Αναζήτηση της βιβλιοθήκης φωνής και να επιλέξετε μια φωνή σημαδεμένη με το σήμα VITS. Η πολυφωνική βιβλιοθήκη VITS, συμπεριλαμβανομένου του σετ ηχείων VCTK, σας επιτρέπει να επιλέξετε από πολλές διαφορετικές φωνές.
-
3
Εισάγετε το κείμενο σας
Πληκτρολογήστε ή επικολλήστε το κείμενο που θέλετε μιλήσει στον επεξεργαστή. VITS χειρίζεται καλά τα μεγάλα περάσματα και είναι ιδανικό για την παρτίδα και υψηλή περιεκτικότητα σε όγκο.
-
4
Δημιουργία ήχου
Κάντε κλικ για να συνθέσει την ομιλία με VITS. Επειδή VITS είναι πολύ γρήγορη και Standard-tier (10 μονάδες ανά 1000 χαρακτήρες), τα αποτελέσματα επιστρέφουν γρήγορα με χαμηλό κόστος.
-
5
Κατεβάστε ή χρησιμοποιήστε το API
Κατεβάστε τον τελικό ήχο ως MP3, WAV, ή OGG, ή καλέστε την ίδια φωνή VITS μέσω του TextToSpeechAI REST API για να αυτοματοποιήσετε τη γενιά στη δική σας εφαρμογή.
ΒΙΤΣ API
Δημιουργήστε την ομιλία προγραμματικά χρησιμοποιώντας το TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Τα VITS παρέχουν γρήγορη, φυσική ομιλία για εφαρμογές μεγάλου όγκου.",
"voice": "vits-ljspeech"
}'
Συχνές Ερωτήσεις
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10