Parler-TTS

Premium

Γενιά φωνής που περιγράφεται στο κείμενο

Moderate Ταχύτητα
Very Good Ποιότητα
Όχι. Κλωνοποίηση
1 Γλώσσες

Σχετικά Parler-TTS

Το Parler-TTS είναι ένα μοναδικό μοντέλο κειμένου προς ομιλία που δημιουργεί φωνές βασισμένες σε περιγραφές κειμένου. Αντί να επιλέξετε από προκαθορισμένες φωνές, περιγράφετε τη φωνή που θέλετε: "Μια νεαρή γυναίκα μιλάει καθαρά με αμερικανική προφορά" ή "Ένας ηλικιωμένος Βρετανός μιλάει αργά σε μια βαθιά φωνή."

Βασικά χαρακτηριστικά

Περιγραφή κειμένου

Δημιουργήστε φωνές περιγράφοντας τα επιθυμητά χαρακτηριστικά.

Creative Control

Καθορίστε την ηλικία, το φύλο, την προφορά, την ταχύτητα και το ύφος ομιλίας.

Μοναδικές Φωνές

Δημιουργήστε φωνές που δεν υπάρχουν σε προ-δημιουργημένες βιβλιοθήκες.

Φυσική έξοδος

Δημιουργεί υψηλής ποιότητας, φυσικό ήχο λόγου.

Αποτελεσματικό

Γρήγορο συμπέρασμα για την περιγραφή της γενιάς φωνής.

Άνοιγμα πηγής

Απάτσι 2.0 άδεια για εμπορική χρήση.

Υpiοθέσει χρήση

Σχεδιασμός φωνής χαρακτήρων Creative Projects Prototype Voiceovers Ανάπτυξη Παιχνιδιού Χαρακτήρες ακουστικών Προσαρμοσμένη Δημιουργία Φωνής

Parler-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Πώς να χρησιμοποιήσετε το φάρμακο Parler-TTS

  1. 1

    Εγγραφείτε δωρεάν ή δοκιμάστε το demo

    Δημιουργήστε ένα δωρεάν λογαριασμό TextToSpeechAI για 200 μονάδες εκκίνησης, ή ανοίξτε το demo για να δοκιμάσετε Parler-TTS αμέσως χωρίς να εγγραφείτε.

  2. 2

    Επιλέξτε Parler-TTS και γράψτε μια περιγραφή φωνής

    Επιλέξτε Parler-TTS ως μηχανή σας, στη συνέχεια γράψτε μια απλή-κείμενο περιγραφή φωνής όπως "Μια νεαρή γυναίκα μιλάει καθαρά με αμερικανική προφορά." Συμπεριλάβετε την ηλικία, το φύλο, την προφορά, το ρυθμό, και τη διάθεση να διαμορφώσει τη φωνή.

  3. 3

    Εισάγετε το κείμενο για να μιλήσετε

    Parler-TTS καθιστά αυτό το κείμενο στη φωνή που ορίζεται από την περιγραφή σας, έτσι ώστε να κρατήσει την περιγραφή και το σενάριο στην ίδια γλώσσα (Αγγλικά έργα καλύτερα).

  4. 4

    Δημιουργήστε την ομιλία

    Κάντε κλικ στη δημιουργία για να στείλετε τη δουλειά στο backend GPU μας. Parler-TTS συνθέτει φυσικό-ηχητικό που ταιριάζει φωνή σας περιγράφεται, χρεώθηκε στην Premium βαθμίδα των 25 μονάδων ανά 1000 χαρακτήρες.

  5. 5

    Κατεβάστε ή καλέστε το API

    Κατεβάστε τον τελικό ήχο ως MP3, WAV, ή OGG, ή αυτοματοποιήστε τη γενιά μέσω του TextToSpeechAI API, περνώντας το κείμενο σας και αποθηκεύοντας την περιγραφή φωνής σε κάθε αίτημα.

Parler-TTS API

Δημιουργήστε την ομιλία προγραμματικά χρησιμοποιώντας το TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Μια χαρούμενη νεαρή γυναίκα μιλάει με αμερικάνικη προφορά.",
    "voice": "parler-female_american"
  }'

Συχνές Ερωτήσεις

Parler-TTS είναι ένα μοντέλο κειμένου προς ομιλία που παράγει φωνές από περιγραφές κειμένου. Αντί να επιλέξετε προ-δημιουργημένες φωνές, περιγράφετε αυτό που θέλετε: "Μια ήρεμη, ώριμη γυναίκα με μια αυστραλιανή προφορά που μιλάει με μέτριο ρυθμό."

Η Parler-TTS είναι ανοικτή πηγή με άδεια Apache 2.0. Στις TextToSpeechAI, χρεώνουμε 25 μονάδες ανά 1000 χαρακτήρες (Premium βαθμίδα) για τις μοναδικές δυνατότητες παραγωγής φωνής.

Οι φωνητικές περιγραφές λειτουργούν καλύτερα στα αγγλικά, αν και το μοντέλο μπορεί να χειριστεί διάφορες αγγλικές προφορές (Αμερικάνικη, Βρετανική, Αυστραλιανή, κ.λπ.).

Περιγράψτε χαρακτηριστικά φωνής φυσικά: "Μια νεαρή γυναίκα μιλάει καθαρά με βρετανική προφορά" ή "Ένας ηλικιωμένος άντρας με βαθιά φωνή μιλάει αργά και προσεκτικά."

Parler-TTS έχει μέτρια ταχύτητα παραγωγής, συνήθως 2-5 δευτερόλεπτα ανά πρόταση για GPU. Η επεξεργασία περιγραφής φωνής προσθέτει ελάχιστη εναέρια σε σύγκριση με την πραγματική γενιά ομιλίας.

Όχι, η Parler-TTS παράγει φωνές από περιγραφές αντί να κλωνοποιεί τις υπάρχουσες φωνές. Για κλωνοποίηση φωνής, χρήση StyleTTS2, F5-TTS, OpenVoice, ή Tortoise.

Parler-TTS απαιτεί 4-8GB της VRAM ανάλογα με το μέγεθος του μοντέλου. Η μίνι έκδοση λειτουργεί με 4GB, ενώ το πλήρες μοντέλο ωφελείται από 8GB για βέλτιστη απόδοση.

Ναι, Parler-TTS είναι Apache 2.0 άδεια και υποστηρίζει την εμπορική χρήση. Δεδομένου ότι οι φωνές παράγονται από περιγραφές, δεν υπάρχουν ανησυχίες φωνητικής ιδιοκτησίας.

Συμπεριλάβετε την περιγραφή της φωνής σας στο αίτημα API μαζί με το κείμενό σας. Το API επεξεργάζεται την περιγραφή και δημιουργεί την αντίστοιχη ομιλία. Μπορείτε να αποθηκεύσετε αγαπημένες περιγραφές για επαναχρησιμοποίηση.

Parler-TTS παράγει πολύ καλό, φυσικό-ήχο ήχου με προσθετικό που ταιριάζει με την περιγραφή φωνή σας. Εξέρχεται WAV εγγενώς, και στις TextToSpeechAI μπορείτε να το κατεβάσετε ως MP3, WAV, ή OGG με αυτόματη μετατροπή.

Και οι δύο είναι εκφραστικές, ανοιχτές μηχανές, αλλά διαφέρουν στον έλεγχο. Parler-TTS σας επιτρέπει να κατευθύνετε τη φωνή με μια απλή-κείμενο περιγραφή (ηλικία, προφορά, ρυθμό, διάθεση), ενώ Bark προσθέτει μη λεκτική στέκες όπως [γέλια] και μουσική. Επιλέξτε Parler-TTS όταν θέλετε μια συγκεκριμένη περιγραφή φωνή και Bark όταν θέλετε αυθόρμητη συναισθηματική παράδοση.

Ναι. Εγγραφείτε για έναν δωρεάν λογαριασμό στις TextToSpeechAI για να λάβετε 200 μονάδες εκκίνησης, ή να χρησιμοποιήσετε το demo για να ακούσετε Parler-TTS χωρίς λογαριασμό.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Parler-TTS Now

Generate your first audio free. No credit card required.

Start Free