Kokoro
StandardHitro strele, lahka TTS z naravno kakovostjo
O projektu Kokoro
Kokoro je ultra-lahek parametr 82M TTS model, ki zagotavlja naravno-zvočni govor z neverjetno hitrostjo. Teče v bližini realnega časa tudi na CPU, kar je idealno za aplikacije, kjer je nizka latenčnost kritična. Kokoro podpira več jezikov in ponuja glasovne zmožnosti mešanja.
Ključne lastnosti
Ultra- lahka
82M parametrov, ~300MB velikost modela. Teče na CPU z minimalnimi viri.
Blizu realnega časa
Ustvari govor hitreje od hitrosti predvajanja, tudi brez pospeška GPU.
Večjezični
Podpira angleško, francosko, špansko, hindijsko, japonsko, kitajsko, italijansko, portugalsko in korejsko.
Zmešavanje glasu
Zmešaj dva glasova, da ustvariš edinstvene kombinacije glasov.
Uporabne primere
Kako uporabljati Kokoro
-
1
Vpišite se brezplačno ali poskusite demo
Ustvarite brezplačni TextToSpeechAI račun za pridobitev 200 zagonskih kreditov, ali uporabite brez odjave demo za takojšnje poslušanje Kokora. Standardna stopnja pomeni Kokoro stane samo 10 kreditov na 1000 znakov.
-
2
Izberi kokorski glas
Odprite brskalnik glasov in izberite kokorski glas v vašem ciljnem jeziku (9 podprti, od angleščine do japonske in korejske). Uporabite lahko tudi Kokoro glas mešanico za mešanje dveh glasov v custom kombinacijo.
-
3
Vnesite svoje besedilo
Vnesite ali vlepite besedilo, ki ga želite govoriti v urednik. Kokoro upravlja dolge prehode učinkovito zahvaljujoč njegovi lahki 82M-parameter, blizu motorja v realnem času.
-
4
Prilagodi hitrost in ustvari
Nastavite hitrost predvajanja, da ustreza vašemu uporabniškemu številu, nato kliknite Generiraj. Kokoro odvaja zvok hitreje kot v realnem času, tako da je vaš govor pripravljen skoraj takoj.
-
5
Prenesi ali uporabi API
Prenesi končan zvok kot MP3 ali WAV ali avtomatsko generacijo skozi TextToSpeechAI REST API na api.texttospeechai.com za serijsko in realno delovno obremenitev.
Kokoro API
Ustvarite govor programsko z uporabo TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro zagotavlja naravni govor z neverjetno hitrostjo in učinkovitostjo.",
"voice": "en_US-lessac-medium"
}'
Pogosta vprašanja
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10