Kokoro

Standard

Hitro strele, lahka TTS z naravno kakovostjo

Very Fast Hitrost
Good Kakovost
Ne Kloniranje
9 Jeziki

O projektu Kokoro

Kokoro je ultra-lahek parametr 82M TTS model, ki zagotavlja naravno-zvočni govor z neverjetno hitrostjo. Teče v bližini realnega časa tudi na CPU, kar je idealno za aplikacije, kjer je nizka latenčnost kritična. Kokoro podpira več jezikov in ponuja glasovne zmožnosti mešanja.

Ključne lastnosti

Ultra- lahka

82M parametrov, ~300MB velikost modela. Teče na CPU z minimalnimi viri.

Blizu realnega časa

Ustvari govor hitreje od hitrosti predvajanja, tudi brez pospeška GPU.

Večjezični

Podpira angleško, francosko, špansko, hindijsko, japonsko, kitajsko, italijansko, portugalsko in korejsko.

Zmešavanje glasu

Zmešaj dva glasova, da ustvariš edinstvene kombinacije glasov.

Uporabne primere

Realnočasovni klepetalniki in virtualni pomočniki Live streaming text-to-speech Uporaba roba in mobilne aplikacije Obdelava serije z veliko količino

Kako uporabljati Kokoro

  1. 1

    Vpišite se brezplačno ali poskusite demo

    Ustvarite brezplačni TextToSpeechAI račun za pridobitev 200 zagonskih kreditov, ali uporabite brez odjave demo za takojšnje poslušanje Kokora. Standardna stopnja pomeni Kokoro stane samo 10 kreditov na 1000 znakov.

  2. 2

    Izberi kokorski glas

    Odprite brskalnik glasov in izberite kokorski glas v vašem ciljnem jeziku (9 podprti, od angleščine do japonske in korejske). Uporabite lahko tudi Kokoro glas mešanico za mešanje dveh glasov v custom kombinacijo.

  3. 3

    Vnesite svoje besedilo

    Vnesite ali vlepite besedilo, ki ga želite govoriti v urednik. Kokoro upravlja dolge prehode učinkovito zahvaljujoč njegovi lahki 82M-parameter, blizu motorja v realnem času.

  4. 4

    Prilagodi hitrost in ustvari

    Nastavite hitrost predvajanja, da ustreza vašemu uporabniškemu številu, nato kliknite Generiraj. Kokoro odvaja zvok hitreje kot v realnem času, tako da je vaš govor pripravljen skoraj takoj.

  5. 5

    Prenesi ali uporabi API

    Prenesi končan zvok kot MP3 ali WAV ali avtomatsko generacijo skozi TextToSpeechAI REST API na api.texttospeechai.com za serijsko in realno delovno obremenitev.

Kokoro API

Ustvarite govor programsko z uporabo TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro zagotavlja naravni govor z neverjetno hitrostjo in učinkovitostjo.",
    "voice": "en_US-lessac-medium"
  }'

Pogosta vprašanja

Kokoro je ultra-lahek model besedila-to-špice s samo 82 milijoni parametrov. Kljub majhni velikosti, ustvarja naravno-zvočni govor v več jezikih z skoraj realno hitrostjo, tudi pri CPU.

Da, Kokoro je popolnoma Apači 2.0 licencirano - tako koda kot model uteži. Lahko se uporablja prosto v komercialnih aplikacijah brez omejitev.

Kokoro podpira angleško (ZDA in Britanija), francosko, špansko, hindijsko, japonsko, kitajsko, italijansko, portugalsko in korejsko.

Kokoro je eden od najhitrejših TTS modelov, ki so na voljo. To ustvarja govor hitrejši od hitrosti predvajanja v realnem času tudi na CPU, kar je idealno za interaktivne aplikacije.

Ne, Kokoro ne podpira kloniranja glasu. Uporablja kurirano glasovno knjižnico z zmožnostjo mešanja glasu. Za kloniranje glasu uporabite F5-TTS, Chatterbox, StyleTTS2, OpenVoice ali Tortoise.

Kokoro lahko zmeša dva glasova skupaj, da ustvarite edinstvene kombinacije. To vam omogoča ustvarjanje posebnih glasovnih lastnosti brez tradicionalnega kloniranja glasu.

Oba sta hitri, lahki modeli. Kokoro ima bolj moderno arhitekturo in podpira zmešavanje glasu, medtem ko Piper ima večjo glasovno knjižnico. Oba sta odlična za aplikacije v realnem času.

Kokoro je zasnovan za tekoče na CPU in zahteva minimalne vire - približno 300MB. GPU ni potreben, čeprav je pospešek GPU podprt za še hitrejšo obdelavo.

Da. Kokoro ustvarja govor hitreje kot predvajanje celo na CPU, z zelo nizkim latencijo, tako da je odlično primeren za chatbots, glasovne pomočnike in živo streaming. Njegova velikost 82M-parameter ohranja uporabo spomina majhna, da je praktičen za visoko volumno in rob napotitve.

Glasovna mešanica vam omogoča, da zmešate dva glasova Kokoro skupaj, da ustvarite edinstveno kombinacijo s po meri. To ni tradicionalno kloniranje glasu - ne morete reproducirati določene osebe iz vzorca - vendar vam daje več raznolikosti kot fiksna glasovna knjižnica. Lahko eksperimentirate z mešanicami neposredno v TextToSpeechAI urednik.

Oba sta hitra, prijazna za CPU standardni motorji brez kloniranja glasu. Kokoro je najlažji (približno 300MB) in podpira glas zmešavanje v devetih jezikih, Medtem ko se Melotts osredotoča na več angleških naglasov in v realnem času večjezično izhod. Izberite Kokoro za najmanjši odtis in mešanico; izberite Melotts, ko potrebujete specifičen naglas.

Kokoro je standardni motor, ki stane 10 kreditov na 1000 znakov - najnižji razred na TextToSpeechAI. Novi računi dobijo 200 brezplačnih kreditov, tako da lahko poskusite Kokoro brez plačila. To je eden od najbolj stroškovno učinkovitih načinov za ustvarjanje visokokakovostnega govora na lestvici.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokoro Now

Generate your first audio free. No credit card required.

Start Free