CosyVoice2
PremiumZero-shot πολύγλωσση κλωνοποίηση φωνής με υποστήριξη ροής
Σχετικά CosyVoice2
Το CosyVoice2 είναι ένα μοντέλο σύνθεσης ομιλίας επόμενης γενιάς από το FunAudioLLM (Alibaba). Προσφέρει φυσική ήχο μηδενικής φωνής κλωνοποίησης σε πολλές γλώσσες με δυνατότητα ροής για εφαρμογές χαμηλής βαρύτητας.
Βασικά χαρακτηριστικά
Zero-Shot Voice Cloning
Κλώνε οποιαδήποτε φωνή από 3-10 δευτερόλεπτα ήχου αναφοράς με υψηλή πιστότητα.
Πολύγλωσσο
Υποστηρίζει Κινέζικα, Αγγλικά, Ιαπωνικά, Κορεάτικα και Καντονέζικα με διαγλωσσική σύνθεση.
Streaming Support
Λειτουργία ροής χαμηλής βαρύτητας για εφαρμογές σε πραγματικό χρόνο και διαδραστικά συστήματα.
Φυσική ΠροσωδίαCity name (optional, prosody)
Προχωρημένη μοντελοποίηση προσθετικότητας παράγει φυσικό-ηχητικό λόγο με κατάλληλο τονισμό.
Υpiοθέσει χρήση
Πώς να χρησιμοποιήσετε το φάρμακο CosyVoice2
-
1
Εγγραφείτε και διεκδικήστε δωρεάν πιστώσεις
Δημιουργήστε ένα δωρεάν λογαριασμό TextToSpeechAI για να διεκδικήσετε τις μονάδες εκκίνησης σας, ή δοκιμάστε πρώτα το demo. Δεν GPU ή τοπική εγκατάσταση CosyVoice2 είναι απαραίτητη - όλα τρέχουν στην υποδομή μας.
-
2
Επιλέξτε CosyVoice2 και προσθέστε ένα κλιπ αναφοράς
Επιλέξτε CosyVoice2 ως κινητήρα σας, στη συνέχεια, ανεβάστε μια καθαρή 3-10 δεύτερη εγγραφή αναφοράς της φωνής που θέλετε να κλωνοποιήσετε. CosyVoice2 θα εξαγάγει τα χαρακτηριστικά ηχείων για μηδέν-shot πολύγλωσση κλωνοποίηση.
-
3
Εισάγετε το κείμενο σας σε οποιαδήποτε υποστηριζόμενη γλώσσα
Πληκτρολογήστε ή επικολλήστε το σενάριό σας σε κινέζικα, αγγλικά, ιαπωνικά, κορεάτικα ή καντονέζικα. Η CosyVoice2 υποστηρίζει τη διαγλωσσική σύνθεση, ώστε η κλωνοποιημένη φωνή να μπορεί να μιλήσει μια γλώσσα διαφορετική από το κλιπ αναφοράς.
-
4
Δημιουργήστε την ομιλία
Κάντε κλικ στην παραγωγή και η CosyVoice2 συνθέτει φυσική, πολύγλωσση ομιλία στην κλωνοποιημένη φωνή, συνήθως μέσα σε δευτερόλεπτα για σύντομο κείμενο. Premium-tier χρήση κοστίζει 25 μονάδες ανά 1.000 χαρακτήρες.
-
5
Κατεβάστε ή χρησιμοποιήστε το API
Κατεβάστε τον τελικό ήχο ως MP3 ή WAV από την ιστορία σας, ή αυτοματοποιήστε CosyVoice2 φωνητική κλωνοποίηση σε κλίμακα μέσω του TextToSpeechAI REST API.
CosyVoice2 API
Δημιουργήστε την ομιλία προγραμματικά χρησιμοποιώντας το TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Η CosyVoice2 παρέχει φυσική πολύγλωσση ομιλία με μηδενική ικανότητα κλωνοποίησης φωνής.",
"voice": "en_US-lessac-medium"
}'
Συχνές Ερωτήσεις
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25