Pocket TTS

Standard

Ultra-könnyű hang klónozása, ami valós idejű CPU-n fut

Very Fast Sebesség
Good Minőség
Igen. Klónozás
2 Nyelvek

About Pocket TTS

A Kyutai Pocket TTS egy ultra könnyű 100M paraméterű szöveg-példa modell, amely valós időben fut a CPU-n. Annak ellenére, hogy kicsi méretben, támogatja a hang klónozását mindössze 5 másodperc referencia audió. Tökéletes élkiépítés, mobil alkalmazások, és forgatókönyvek, ahol GPU források korlátozott. Jelenleg támogatja az angol és a francia.

Kulcsfontosságú jellemzők

Ultra- könnyűsúly

100M paraméterek - valós idejű futtatása CPU minimális forrásokkal.

Hang klónozása

Klón bármilyen hang mindössze 5 másodperc referencia hang, még a CPU.

Valós idejű CPU-n

A beszéd valós idejű sebességgel generál standard hardveren.

Edge- ready

Elég kicsi a mobil eszközök, málna Pi, és beágyazott rendszerek.

Esetek használata

Edge és mobil alkalmazás Valós idejű hangsegítők a CPU-n IoT és beágyazott eszközök Alacsony resource hang klónozása

Hogyan kell alkalmazni? Pocket TTS

  1. 1

    Regisztráljon ingyen vagy próbálja ki a demót

    Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy megkapja az indító krediteket, vagy használja a helyszíni demót a Pocket TTS hallgatásához a regisztráció előtt. Nincs szükség GPU-ra vagy helyi telepítésre.

  2. 2

    Válassza ki a Pocket TTS-t és adjon hozzá hangot a klónhoz

    Válassza ki a Pocket TTS-t motorként, majd töltsön fel egy rövid, körülbelül 5-10 másodperces referenciacsipeszt a hang klónozására. Pocket TTS teljesen a CPU-n fut, így a klónozás gyors és könnyű.

  3. 3

    Írja be a szöveget

    Írja be vagy illessze be az angol vagy francia szöveget, amit szeretne. Tartsa szemmel a karakterszámot, mivel Pocket TTS számlák a normál árfolyam 10 kredit 1000 karakterenként.

  4. 4

    Hang generálása

    Kattintson a generálás és Pocket TTS szintetizálja a szöveget a klónozott hang valós idejű sebesség. A legtöbb klipek készen vannak másodpercek, mert a modell olyan kicsi és CPU-hatékony.

  5. 5

    Az API letöltése vagy használata

    Töltse le a kész audio, vagy automatizálja generáció keresztül a TextToSpeechAI REST API api.texttospeechai.com segítségével a számla token. Az API felfedi ugyanazt a Pocket TTS klónozás és szintézis a saját alkalmazások.

Pocket TTS API

A beszéd programszerű generálása a TextToSpeechAI REST API használatával.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "A Pocket TTS hang klónozást ad, ami valós időben fut, még a CPU\u002Dn is.",
    "voice": "en_US-lessac-medium"
  }'

Gyakran ismételt kérdések

A Pocket TTS egy ultrakönnyű szöveg-nyelv modell Kyutai-tól, mindössze 100 millió paraméterrel. Valós időben fut a CPU-n és támogatja a hang klónozását 5 másodpercnyi audióból.

A Pocket TTS a CC-BY-4,0 alatt engedélyezett, amely lehetővé teszi a kereskedelmi célú felhasználást a hozzárendeléssel. A Kyutai-nak a kereskedelmi alkalmazásokban történő használatakor kell hitelt adnia.

Jelenleg a Pocket TTS támogatja az angol és a francia nyelveket. A későbbi kiadásban több nyelv is hozzáadható.

Igen! A Pocket TTS csak 100M paraméterekkel rendelkezik, valós idejű sebességgel fut a szabványos CPU hardveren. Nincs szükség GPU-ra, így ideális a széle telepítéséhez és mobil alkalmazásokhoz.

Mindkettő könnyű és jól fut a CPU. Pocket TTS egyedülállóan támogatja hang klónozás (Kokoro nem). Kokoro támogatja több nyelv (9 vs 2). Válassza ki a Pocket TTS, ha szükség van könnyű hang klónozás, Kokoro, ha több nyelvi lefedettség.

A Pocket TTS kivonata hangszóró jellemzői és új beszédeket tud generálni ebben a hangban. A minőség hosszabb referenciákkal (legfeljebb 10 másodperc) javul.

Igen. A legtöbb klónozó modelltől eltérően, amihez GPU szükséges, a Pocket TTS a CPU-n teljesen nulla lövéses hangot klónoz, köszönhetően annak a 100M-es kis lábnyomának. Egy rövid klipből akár laptopon vagy egylapos számítógépen is lemásolhat egy hangot.

A Pocket TTS a CC-BY-4,0 alatt jelenik meg, ezért a Kyutai-t kell az eredeti alkotónak tekinteni, amikor használja vagy újraosztja. Egyszerű besorolás, mint például a Kyutai Pocket TTS-ével előállított Voice, megfelel a kereskedelmi és nem kereskedelmi célú licencnek.

A Pocket TTS valós időben vagy gyorsabban, standard CPU-n, GPU nélkül hoz létre beszédet. Ez teszi az egyik legreszponzívabb motort az alacsony latencia-felhasználáshoz, mint például az élő hang asszisztensek és a készüléken történő termelés.

A Pocket TTS a standard árszínvonalban van, 1000 karakterenként 10 kreditbe kerül. Ez teszi az egyik leggazdaságosabb hangklónzási lehetőség a TextToSpeechAI-en.

Mindkettő könnyű, CPU-barát, standard-tier motorok. Válassza Pocket TTS, ha szükség van hang klónozás, mivel Kokoro nem támogatja. Pick Kokoro, ha szükség van szélesebb nyelvi lefedettség, és nem kell klónozni egy adott hangot.

Igen. Az új TextToSpeechAI fiók ingyenes kezdő kreditet kap, és a helyszíni demó lehetővé teszi, hogy a Pocket TTS-t halld, mielőtt elkötelezed magad. Jelentkezzen ingyen, töltsön fel egy rövid referencia klipet, és klónozott beszédet hozzon létre másodpercek alatt.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Pocket TTS Now

Generate your first audio free. No credit card required.

Start Free