ΝτίαCity name (optional, probably does not need a translation)
UltraTTS προσανατολισμένη στο διάλογο με κλωνοποίηση φωνής και μη λεκτική ήχους
Σχετικά ΝτίαCity name (optional, probably does not need a translation)
Το Dia by Nari Labs είναι ένα μοντέλο διαλόγου 1.6B παραμέτρων που επικεντρώνεται σε κείμενο προς ομιλία. Υπερέχει στη δημιουργία φυσικής ομιλίας συνομιλίας με υποστήριξη για μη ομιλητικούς ήχους όπως γέλιο, αναστεναγμούς και βήχα.
Βασικά χαρακτηριστικά
Γενιά διαλόγου
Δημιουργήστε φυσικές πολυ-συνομιλίες με διακριτές φωνές και turn-taking.
Μη Διαλεκτική Ήχοι
Προσθέστε [γέλια], [αναστενάζει], [βήχας], (λαχανιάζει) για φυσική παράγλωσση έκφραση.
Κλωνοποίηση φωνής
Κλώνε οποιαδήποτε φωνή από 5-10 δευτερόλεπτα ήχου αναφοράς για εξατομικευμένη ομιλία.
Φυσική Συνομιλία
1.6B παράμετροι παράγουν εξαιρετικά φυσική συνομιλία προσθετικότητα και τονισμό.
Υpiοθέσει χρήση
Πώς να χρησιμοποιήσετε το φάρμακο ΝτίαCity name (optional, probably does not need a translation)
-
1
Εγγραφείτε δωρεάν ή ανοίξτε το demo
Δημιουργήστε έναν δωρεάν λογαριασμό TextToSpeechAI για να διεκδικήσετε τις μονάδες εκκίνησης σας, ή ανοίξτε το demo χωρίς υπογραφή για να δοκιμάσετε τον διάλογο Dia αμέσως.
-
2
Επιλέξτε τον κινητήρα Dia
Στο ταμπλό TTS επιλέξτε Dia από τη λίστα μηχανών. Dia είναι το προσανατολισμένο στο διάλογο, εξαιρετικά-tier μοντέλο με πολυ-επεξεργαστή και φωνητική υποστήριξη.
-
3
Γράψτε ένα σενάριο διαλόγου με ετικέτες
Συγκρίνετε τη συνομιλία σας χρησιμοποιώντας [S1] και [S2] για να σημαδέψετε κάθε ομιλητή, και να ρίξετε σε μη ομιλητικές ετικέτες όπως [γέλια], [αναστενάζει], [βήχας], ή (λαχανιάζει) όπου θέλετε φυσικές αντιδράσεις.
-
4
Δημιουργία ήχου
Κάντε κλικ στη δημιουργία για να στείλετε το σενάριό σας Dia σε φιλοξενούμενους GPUs μας. Dia καθιστά το διάλογο δύο ηχείων με τη λήψη στροφής και μη λεκτική ετικέτες σας σε ένα ενιαίο αρχείο ήχου.
-
5
Κατεβάστε ή καλέστε το API
Κατεβάστε τον τελικό διάλογο στην επιλεγμένη μορφή σας, ή αυτοματοποιήστε τον με την ανάρτηση του ίδιου σεναρίου [S1]/[S2] στο TextToSpeechAI API με το σήμα του λογαριασμού σας.
ΝτίαCity name (optional, probably does not need a translation) API
Δημιουργήστε την ομιλία προγραμματικά χρησιμοποιώντας το TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Τα πάω μια χαρά, ευχαριστώ που ρωτάς!",
"voice": "en_US-lessac-medium"
}'
Συχνές Ερωτήσεις
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50
Try ΝτίαCity name (optional, probably does not need a translation) Now
Generate your first audio free. No credit card required.
Start Free