Tietoja Kokoro
Kokoro on ultrakevyt 82M-parametri TTS-malli, joka tuottaa luonnolta kuulostavaa puhetta uskomattoman nopeasti. Se toimii lähes reaaliaikaisesti jopa prosessorilla, mikä tekee siitä ihanteellisen sovelluksiin, joissa matala latenssi on kriittinen. Kokoro tukee useita kieliä ja tarjoaa äänensekoituskykyä.
Tärkeimmät ominaisuudet
Ultra-kevytpaino
82M-parametrit, ~300MB-mallin koko. Suorittaa prosessoria vähin resurssein.
Lähellä reaaliaikaista
Puhe syntyy nopeammin kuin toistonopeus, jopa ilman GPU-kiihdytystä.
Monikielisyys
Tukee englantia, ranskaa, espanjaa, hindiä, japania, kiinaa, italiaa, portugalia ja koreaa.
Äänien sekoittuminen
Sekoita kaksi ääntä yhteen ja luo ainutlaatuisia ääniyhdistelmiä.
Käytä tapauksia
Miten sitä käytetään Kokoro
-
1
Rekisteröidy ilmaiseksi tai kokeile demoa
Luo ilmainen TextToSpeechAI-tili, jolla saat 200 starttipistettä, tai käytä ilman allekirjoitusta -demoa kuullaksesi Kokoron välittömästi. Normaalitaso tarkoittaa, että Kokoro maksaa vain 10 krediittiä tuhatta merkkiä kohti.
-
2
Valitse Kokoro-ääni
Avaa ääniselain ja valitse kohdekielelläsi Kokoro-ääni (9 tuettua, englanniksi japaniksi ja koreaksi). Voit myös käyttää Kokoro-ääntä yhdistelemään kahta ääntä mukautetuksi yhdistelmäksi.
-
3
Syötä teksti
Kirjoita tai liitä teksti, jonka haluat puhutella toimittajaa. Kokoro käsittelee pitkiä kappaleita tehokkaasti kevyen 82M-parametrinsa ansiosta, joka on lähellä reaaliaikaista moottoria.
-
4
Säädä nopeutta ja luo
Aseta soittonopeus käyttökoteloosi sopivaksi ja napsauta sitten Generate. Kokoro tekee äänen nopeammin kuin reaaliaikaisesti, joten puheesi on valmis lähes välittömästi.
-
5
Lataa tai käytä API-rajapintaa
Lataa valmis ääni MP3:na tai WAV:na tai automatisoi sukupolven TextToSpeechAI REST API:n kautta api.texttospeechai.com-palvelussa erä- ja reaaliaikaisiin työmääriin.
Kokoro API
Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro pitää luontevaa puhetta uskomattoman nopeasti ja tehokkaasti.",
"voice": "en_US-lessac-medium"
}'
Usein kysyttyjä kysymyksiä
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10