Τσέπη TTS

Standard

Εξαιρετικά ελαφριά κλωνοποίηση φωνής που τρέχει σε πραγματικό χρόνο σε CPU

Very Fast Ταχύτητα
Good Ποιότητα
Ναι. Κλωνοποίηση
2 Γλώσσες

Σχετικά Τσέπη TTS

Pocket TTS by Kyutai είναι ένα εξαιρετικά ελαφρύ μοντέλο παραμέτρων 100M κείμενο προς ομιλία που τρέχει σε πραγματικό χρόνο σε CPU. Παρά το μικρό του μέγεθος, υποστηρίζει την κλωνοποίηση φωνής από μόλις 5 δευτερόλεπτα του ήχου αναφοράς. Τέλειο για την ανάπτυξη άκρη, mobile εφαρμογές, και σενάρια όπου οι πόροι GPU είναι περιορισμένες.

Βασικά χαρακτηριστικά

Υπερβολικό βάρος

100M παράμετροι - τρέχει σε πραγματικό χρόνο σε CPU με ελάχιστους πόρους.

Κλωνοποίηση φωνής

Κλώνε οποιαδήποτε φωνή από μόλις 5 δευτερόλεπτα του ήχου αναφοράς, ακόμη και σε CPU.

Πραγματικός χρόνος για CPU

Δεν απαιτείται GPU. Δημιουργεί την ομιλία σε πραγματικό χρόνο ταχύτητα σε κανονικό υλικό.

Edge-Ready

Αρκετά μικρό για κινητές συσκευές, Raspberry Pi, και ενσωματωμένα συστήματα.

Υpiοθέσει χρήση

Εκκίνηση και εγκατάσταση κινητής τηλεφωνίας Βοηθοί φωνής σε πραγματικό χρόνο σε CPU IoT και ενσωματωμένες συσκευές Κλωνοποίηση φωνής χαμηλής πηγής

Πώς να χρησιμοποιήσετε το φάρμακο Τσέπη TTS

  1. 1

    Εγγραφείτε δωρεάν ή δοκιμάστε το demo

    Δημιουργήστε ένα δωρεάν λογαριασμό TextToSpeechAI για να λάβετε μονάδες εκκίνησης, ή να χρησιμοποιήσετε το demo επί τόπου για να ακούσετε Pocket TTS πριν από την εγγραφή. Δεν GPU ή τοπική εγκατάσταση είναι απαραίτητη.

  2. 2

    Επιλέξτε Τσεκούρι TTS και προσθέστε μια φωνή στον κλώνο

    Επιλέξτε Pocket TTS ως κινητήρα σας, στη συνέχεια, ανεβάστε ένα σύντομο κλιπ αναφοράς περίπου 5 έως 10 δευτερόλεπτα για να κλωνοποιήσετε αυτή τη φωνή. Pocket TTS τρέχει εξ ολοκλήρου σε CPU, έτσι η κλωνοποίηση είναι γρήγορη και ελαφριά.

  3. 3

    Εισάγετε το κείμενο σας

    Πληκτρολογήστε ή επικολλήστε το αγγλικό ή γαλλικό κείμενο που θέλετε μιλήσει. Παρακολουθήστε τον αριθμό χαρακτήρων, δεδομένου ότι Pocket TTS λογαριασμούς με το κανονικό ποσοστό των 10 μονάδων ανά 1.000 χαρακτήρες.

  4. 4

    Δημιουργία ήχου

    Κάντε κλικ στη δημιουργία και Pocket TTS συνθέτει το κείμενο σας στην κλωνοποιημένη φωνή με ταχύτητα σε πραγματικό χρόνο.

  5. 5

    Κατεβάστε ή χρησιμοποιήστε το API

    Κατεβάστε το τελικό ήχο, ή αυτόματη γενιά μέσω του TextToSpeechAI REST API στο api.texttospeechai.com χρησιμοποιώντας το σήμα λογαριασμού σας. Το API εκθέτει την ίδια Pocket TTS κλωνοποίηση και σύνθεση για τις δικές σας εφαρμογές.

Τσέπη TTS API

Δημιουργήστε την ομιλία προγραμματικά χρησιμοποιώντας το TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Η τσέπη TTS παραδίδει κλωνοποίηση φωνής που τρέχει σε πραγματικό χρόνο, ακόμα και σε CPU.",
    "voice": "en_US-lessac-medium"
  }'

Συχνές Ερωτήσεις

Το Pocket TTS είναι ένα εξαιρετικά ελαφρύ μοντέλο κειμένου προς ομιλία από το Kyutai με μόνο 100 εκατομμύρια παραμέτρους. Τρέχει σε πραγματικό χρόνο σε CPU και υποστηρίζει την κλωνοποίηση φωνής από 5 δευτερόλεπτα ήχου.

Το Pocket TTS είναι αδειοδοτημένο με άδεια CC-BY-4.0, το οποίο επιτρέπει την εμπορική χρήση με απόδοση. Πρέπει να δίνετε πίστωση στο Kyutai όταν το χρησιμοποιείτε σε εμπορικές εφαρμογές.

Επί του παρόντος η Pocket TTS υποστηρίζει Αγγλικά και Γαλλικά. Περισσότερες γλώσσες μπορούν να προστεθούν σε μελλοντικές κυκλοφορίες.

Ναι! Με μόνο 100M παραμέτρους, Τσέπη TTS τρέχει με ταχύτητα σε πραγματικό χρόνο σε κανονικό υλικό CPU. Δεν GPU είναι απαραίτητη, καθιστώντας το ιδανικό για την ανάπτυξη άκρη και mobile εφαρμογές.

Και οι δύο είναι ελαφρύ και τρέχει καλά σε CPU. Pocket TTS υποστηρίζει μοναδικά την κλωνοποίηση φωνής (Kokoro δεν. Kokoro υποστηρίζει περισσότερες γλώσσες (9 vs 2). Επιλέξτε Pocket TTS αν χρειάζεστε ελαφριά κλωνοποίηση φωνής, Kokoro αν χρειάζεστε περισσότερη γλωσσική κάλυψη.

Παρέχετε 5 δευτερόλεπτα του ήχου αναφοράς. Pocket TTS εκχυλίσματα χαρακτηριστικά ηχείων και μπορεί να δημιουργήσει νέα ομιλία σε αυτή τη φωνή. Η ποιότητα βελτιώνεται με μεγαλύτερες αναφορές (μέχρι 10 δευτερόλεπτα).

Ναι. Σε αντίθεση με τα περισσότερα μοντέλα κλωνοποίησης που απαιτούν GPU, Pocket TTS εκτελεί μηδενικής-shot κλωνοποίησης φωνής εξ ολοκλήρου σε CPU χάρη στο μικροσκοπικό αποτύπωμα 100M-παράμετρο. Μπορείτε να κλωνοποιήσετε μια φωνή από ένα σύντομο κλιπ ακόμη και σε ένα φορητό υπολογιστή ή έναν ενιαίο πίνακα υπολογιστή.

Το Pocket TTS κυκλοφορεί υπό CC-BY-4.0, οπότε θα πρέπει να θεωρείτε τον Kyutai ως τον αρχικό δημιουργό όταν το χρησιμοποιείτε ή το αναδιανέμετε. Μια απλή απόδοση όπως "Φωνή που παράγεται με Pocket TTS από Kyutai" πληροί την άδεια για εμπορική και μη εμπορική χρήση εξίσου.

Τσέπη TTS παράγει ομιλία σε πραγματικό χρόνο ή γρηγορότερα σε ένα πρότυπο CPU, χωρίς GPU που απαιτείται. Αυτό το καθιστά ένα από τα πιο ανταποκρίνεται κινητήρες για χαμηλές - Latency περιπτώσεις χρήσης όπως ζωντανές συσκευές φωνής και σε γενιά συσκευών.

Pocket TTS is in the standard pricing tier, costing 10 credits per 1,000 characters. That makes it one of the most economical voice-cloning options available on TextToSpeechAI.

Και οι δύο είναι ελαφριές, φιλικές προς την CPU, πρότυπο-tier κινητήρες. Pick Pocket TTS όταν χρειάζεστε κλωνοποίηση φωνής, δεδομένου ότι το Kokoro δεν το υποστηρίζει. Pick Kokoro όταν χρειάζεστε ευρύτερη γλωσσική κάλυψη και δεν χρειάζεται να κλωνοποιήσετε μια συγκεκριμένη φωνή.

Ναι. Νέοι TextToSpeechAI λογαριασμοί λαμβάνουν δωρεάν μονάδες εκκίνησης, και το on-site demo σας επιτρέπει να ακούσετε Pocket TTS πριν από τη δέσμευση. Εγγραφείτε δωρεάν, ανεβάστε ένα σύντομο κλιπ αναφοράς, και να δημιουργήσει κλωνοποιημένη ομιλία σε δευτερόλεπτα.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Τσέπη TTS Now

Generate your first audio free. No credit card required.

Start Free