Kokoro

Standard

Lightning-nopea, kevyt TTS luonnonlaadulla

Very Fast Nopeus
Good Laatu
Ei tarvitse. Kloonaus
9 Kielet

Tietoja Kokoro

Kokoro on ultrakevyt 82M-parametri TTS-malli, joka tuottaa luonnolta kuulostavaa puhetta uskomattoman nopeasti. Se toimii lähes reaaliaikaisesti jopa prosessorilla, mikä tekee siitä ihanteellisen sovelluksiin, joissa matala latenssi on kriittinen. Kokoro tukee useita kieliä ja tarjoaa äänensekoituskykyä.

Tärkeimmät ominaisuudet

Ultra-kevytpaino

82M-parametrit, ~300MB-mallin koko. Suorittaa prosessoria vähin resurssein.

Lähellä reaaliaikaista

Puhe syntyy nopeammin kuin toistonopeus, jopa ilman GPU-kiihdytystä.

Monikielisyys

Tukee englantia, ranskaa, espanjaa, hindiä, japania, kiinaa, italiaa, portugalia ja koreaa.

Äänien sekoittuminen

Sekoita kaksi ääntä yhteen ja luo ainutlaatuisia ääniyhdistelmiä.

Käytä tapauksia

Reaaliaikaiset chatbotit ja virtuaaliavustajat Suora suoratoistotekstien lähettäminen puhelimesta sanaan Edgen käyttöönotto- ja mobiilisovellukset Suurten erien käsittely

Miten sitä käytetään Kokoro

  1. 1

    Rekisteröidy ilmaiseksi tai kokeile demoa

    Luo ilmainen TextToSpeechAI-tili, jolla saat 200 starttipistettä, tai käytä ilman allekirjoitusta -demoa kuullaksesi Kokoron välittömästi. Normaalitaso tarkoittaa, että Kokoro maksaa vain 10 krediittiä tuhatta merkkiä kohti.

  2. 2

    Valitse Kokoro-ääni

    Avaa ääniselain ja valitse kohdekielelläsi Kokoro-ääni (9 tuettua, englanniksi japaniksi ja koreaksi). Voit myös käyttää Kokoro-ääntä yhdistelemään kahta ääntä mukautetuksi yhdistelmäksi.

  3. 3

    Syötä teksti

    Kirjoita tai liitä teksti, jonka haluat puhutella toimittajaa. Kokoro käsittelee pitkiä kappaleita tehokkaasti kevyen 82M-parametrinsa ansiosta, joka on lähellä reaaliaikaista moottoria.

  4. 4

    Säädä nopeutta ja luo

    Aseta soittonopeus käyttökoteloosi sopivaksi ja napsauta sitten Generate. Kokoro tekee äänen nopeammin kuin reaaliaikaisesti, joten puheesi on valmis lähes välittömästi.

  5. 5

    Lataa tai käytä API-rajapintaa

    Lataa valmis ääni MP3:na tai WAV:na tai automatisoi sukupolven TextToSpeechAI REST API:n kautta api.texttospeechai.com-palvelussa erä- ja reaaliaikaisiin työmääriin.

Kokoro API

Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro pitää luontevaa puhetta uskomattoman nopeasti ja tehokkaasti.",
    "voice": "en_US-lessac-medium"
  }'

Usein kysyttyjä kysymyksiä

Kokoro on ultrakevyt tekstistä ääneen -malli, jolla on vain 82 miljoonaa parametria. Pienestä koostaan huolimatta se tuottaa luonnolta kuulostavaa puhetta useilla eri kielillä lähes reaaliaikaisella nopeudella, jopa suorittimella.

Kokoro on täysin Apache 2.0 -lisenssin saanut - sekä koodi- että mallipainot. Sitä voi käyttää vapaasti kaupallisissa sovelluksissa ilman rajoituksia.

Kokoro tukee englantia (Yhdysvallat ja Britannia), ranskaa, espanjaa, hindiä, japania, kiinaa, italiaa, portugalia ja koreaa.

Kokoro on yksi nopeimmista TTS-malleista, joka tuottaa puheen nopeammin kuin reaaliaikainen toistonopeus jopa suorittimella, mikä tekee siitä ihanteellisen interaktiivisiin sovelluksiin.

Ei, Kokoro ei tue äänen kloonausta. Se käyttää kuratoitua äänikirjastoa, jossa on äänensekoituskykyä. Äänikloonaukseen käytetään F5-TTS:ää, Chatterboxia, Styletts2:ta, OpenVoicea tai Tortoisea.

Kokoro voi yhdistää kaksi ääntä ja luoda ainutlaatuisia yhdistelmiä. Näin voit luoda omia ääniominaisuuksia ilman perinteistä äänen kloonausta.

Molemmat ovat nopeita, kevyitä malleja. Kokorossa on modernimpi arkkitehtuuri ja se tukee äänen sekoittumista, kun taas Piperilla on suurempi äänikirjasto. Molemmat ovat erinomaisia reaaliaikaisiin sovelluksiin.

Kokoro on suunniteltu toimimaan prosessorilla ja vaatii minimaalisia resursseja - noin 300MB. GPU:ta ei tarvita, vaikka GPU:n kiihtyvyyttä tuetaan vielä nopeampaan prosessointiin.

Kyllä. Kokoro tuottaa puheen nopeammin kuin toisto jopa suorittimella, joten se sopii erinomaisesti chatboteille, ääniavustajille ja live-suoratoistoon. Sen 82M-parametrin koko pitää muistin käytössä pienenä, mikä tekee siitä käytännöllisen suuren volyymin ja reunojen käyttöönotossa.

Äänen sekoittaminen mahdollistaa kahden Kokoro-äänen yhdistämisen, jolloin syntyy ainutlaatuinen yhdistelmä, jolla on omat ominaisuutensa. Se ei ole perinteinen äänikloonaus - näytekappaleesta ei voi kopioida tiettyä henkilöä - mutta se antaa sinulle enemmän vaihtelua kuin kiinteä äänikirjasto. Voit kokeilla sekoituksia suoraan TextToSpeechAI editorissa.

Molemmat ovat nopeita, CPU-ystävällisiä vakioluokan moottoreita ilman äänen kloonausta. Kokoro on kevyin (noin 300MB) ja tukee äänen sekoittumista yhdeksällä kielellä, kun taas MeloTTS keskittyy useisiin englanninkielisiin aksentteihin ja reaaliaikaiseen monikieliseen lähtöön. Valitse Kokoro pienimmästä jalanjäljestä ja sekoituksesta; valitse MeloTTS, kun tarvitset erityisiä korostuksia.

Kokoro on vakiomoottori, joka maksaa 10 krediittiä tuhatta merkkiä kohti - TextToSpeechAI merkin alin taso. Uudet tilit saavat 200 krediittiä, joten voit kokeilla Kokoroa maksamatta. Tämä on yksi kustannustehokkaimmista tavoista tuottaa korkeatasoista puhetta mittakaavassa.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokoro Now

Generate your first audio free. No credit card required.

Start Free