KokoroCity name (optional, probably does not need a translation)

Standard

Villámgyors, könnyű TTS természetes minőséggel

Very Fast Sebesség
Good Minőség
Nem. Klónozás
9 Nyelvek

About KokoroCity name (optional, probably does not need a translation)

Kokoro egy ultra könnyű 82M paraméter TTS modell, amely természetes hangzású beszéd hihetetlen sebességgel. Ez fut közel valós idejű még a CPU, így ideális alkalmazások, ahol alacsony latencia kritikus. Kokoro támogatja a több nyelven, és kínál hang keverési képességet.

Kulcsfontosságú jellemzők

Ultra- könnyűsúly

82M paraméterek, ~300MB modell méret. A CPU-n fut minimális forrásokkal.

Közel valós idő

A beszéd gyorsabb, mint a lejátszási sebesség, még GPU gyorsulás nélkül is.

Többnyelvűség

Támogatja az angol, francia, spanyol, hindi, japán, kínai, olasz, portugál és koreai.

Hangok keverése

Keverjünk össze két hangot, hogy egyedi hangkombinációkat hozzunk létre.

Esetek használata

Valós idejű chatbotok és virtuális asszisztensek Élő közvetítés szövegtől-beszédig Edge telepítése és mobil alkalmazások Nagymennyiségű gyártási tétel feldolgozása

Hogyan kell alkalmazni? KokoroCity name (optional, probably does not need a translation)

  1. 1

    Regisztráljon ingyen vagy próbálja ki a demót

    Hozzon létre egy ingyenes TextToSpeechAI számla kap 200 induló kredit, vagy használja a no-signup demo hallani Kokoro azonnal. A standard szint azt jelenti Kokoro csak 10 kredit 1000 karakterenként.

  2. 2

    Válassz egy Kokoro hangot

    Nyissa meg a hang böngészőt, és válassza ki a Kokoro hangot a célnyelven (9 támogatott, angoltól japánig és koreaiig). Használhatja a Kokoro hang keverését is, hogy két hangot keverjen egyedi kombinációba.

  3. 3

    Írja be a szöveget

    Írja be vagy illessze be a kívánt szöveget a szerkesztőbe. Kokoro a könnyű 82M-es paraméterének köszönhetően hatékonyan kezeli a hosszú járatokat, közel valós idejű motorhoz.

  4. 4

    Állítsa be a sebességet és generálja

    Állítsa be a lejátszási sebességet, hogy megfeleljen a felhasználási eset, majd kattintson a Generate. Kokoro teszi hang gyorsabb, mint a valós időben, így a beszéd készen áll szinte azonnal.

  5. 5

    Az API letöltése vagy használata

    Töltse le a kész audió MP3 vagy WAV, vagy automatizálja generáció keresztül a TextToSpeechAI REST API api.texttospeechai.com a gyártási és valós idejű munkaterhelés.

KokoroCity name (optional, probably does not need a translation) API

A beszéd programszerű generálása a TextToSpeechAI REST API használatával.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro természetes beszédet biztosít hihetetlen sebességgel és hatékonysággal.",
    "voice": "en_US-lessac-medium"
  }'

Gyakran ismételt kérdések

Kokoro egy ultra könnyű szöveg-nyelv modell, 82 millió paraméterrel. Kis mérete ellenére, természetes beszédeket készít több nyelven, közel valós idejű sebességgel, még a CPU-n is.

Igen, Kokoro teljesen Apache 2.0 engedéllyel rendelkezik - kód és modellsúlyok egyaránt. Szabadon használható kereskedelmi alkalmazásokban korlátozás nélkül.

Kokoro támogatja az angol (USA és Brit), a francia, a spanyol, a hindi, a japán, a kínai, az olasz, a portugál és a koreai.

Kokoro az egyik leggyorsabb TTS modell elérhető. Gyorsabban generál beszédeket, mint a valós idejű lejátszási sebesség még a CPU-n is, így ideális interaktív alkalmazásokhoz.

Nem, Kokoro nem támogatja a hang klónozást, hanem egy kurált hangkönyvtárat használ hangösszevonó képességekkel. Hang klónozáshoz, F5-TTS, Chatterbox, StyletTS2, OpenVoice vagy Tortoise használatához.

Kokoro két hangot tud összekeverni, hogy egyedi kombinációkat hozzon létre. Így egyedi hangjellemzőket hozhat létre hagyományos hang klónozás nélkül.

Mindkettő gyors, könnyű modellek. Kokoro van egy modern építészet és támogatja a hang keverés, míg Piper van egy nagyobb hangkönyvtár. Mindkettő kiváló a valós idejű alkalmazások.

Kokoro úgy tervezték, hogy CPU futtatására és minimális erőforrásokra van szüksége - körülbelül 300MB. Nincs szükség GPU-ra, bár a GPU gyorsulását támogatják a gyorsabb feldolgozáshoz.

Igen. Kokoro gyorsabban generál beszéd, mint a lejátszás még a CPU-n, nagyon alacsony késéssel, így kiválóan alkalmas chatbotok, hang asszisztensek és élő streaming. 82M-es mérete tartja a memória használata apró, így praktikus a nagy volumenű és éles telepítések.

Hang keverés lehetővé teszi, hogy keverjük két Kokoro hang együtt, hogy hozzon létre egy egyedi kombináció egyedi jellemzőivel. Ez nem hagyományos hang klónozás - nem lehet reprodukálni egy adott személy egy mintából - de ad több változatosságot, mint egy rögzített hang könyvtár. Akkor kísérletezni keverékek közvetlenül a TextToSpeechAI szerkesztő.

Mindkettő gyors, CPU-barát standard-tier motorok hang klónozás nélkül. Kokoro a legkönnyebb (kb. 300MB) és támogatja a hang keverését 9 nyelven, míg a MelotTS összpontosít több angol akcentus és valós idejű többnyelvű kimenet. Válassza ki a Kokoro a legkisebb lábnyom és keverés; válassza a MelotTS, ha szükség van konkrét akcentusok.

Kokoro egy szabványos motor, 10 kredit per 1000 karakter - a legalacsonyabb szint TextToSpeechAI. Új számlák kap 200 ingyenes kredit, így próbálja ki Kokoro fizetés nélkül. Ez teszi az egyik legköltséghatékonyabb módja annak, hogy a magas színvonalú beszéd skála.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try KokoroCity name (optional, probably does not need a translation) Now

Generate your first audio free. No credit card required.

Start Free