Kokors

Standard

Zibens-ātri, vieglie TTS ar dabas kvalitāti

Very Fast Ātrums
Good Kvalitāte
Klonēšana
9 Valodas

Par Kokors

Kokoro ir īpaši vieglais 82M parametrs TTS modelis, kas nodrošina dabīgu un skaņu runājošus vārdus neticami ātri. Tas darbojas pat pie CPU reālā laika, padarot to ideāli piemērotu lietojumiem, kur ir kritiska zema latence. Kokoro atbalsta vairākas valodas un piedāvā balss sajaukšanas iespējas.

Galvenās iezīmes

Gala gaismas svars

82M parametri, ~300MB modeļa izmērs. Palaists pie procesora ar minimālu resursu daudzumu.

Tuvs reālais laiks

Izveido runu ātrāk nekā atskaņošanas ātrumu, pat bez GPU paātrinājums.

Daudzvalodu

Atbalsta angļu, franču, spāņu, hindi, japāņu, ķīniešu, itāļu, portugāļu, un korejiešu.

Balss sajaukšana

Sajauc divas balsis kopā, lai izveidotu unikālas balss kombinācijas.

Lietot gadījumus

Reālā laika tērzēšanas roboti un virtuālie palīgi Dzīvā straumēšana Ietvara izvēršana un mobilās lietotnes Lielapjoma partiju apstrāde

Kā lietot Kokors

  1. 1

    Pierakstīties bezmaksas vai mēģināt demo

    Izveidot bezmaksas TextToSpeechAI kontu, lai iegūtu 200 sākums kredīti, vai izmantot no-signup demo dzirdēt Kokoro uzreiz. Standarta līmenis nozīmē, Kokoro tikai izmaksā 10 kredīti uz 1000 rakstzīmes.

  2. 2

    Izvēlieties Kokoro balsi

    Atveriet balss pārlūkprogrammu un izvēlieties Kokoro balsi mērķa valodā (9 atbalstīta, no angļu līdz japāņu un korejiešu valodā). Jūs varat izmantot arī Kokoro balss sajaukšanu, lai sajauktu divas balsis ar pielāgotu kombināciju.

  3. 3

    Ievadiet tekstu

    Ierakstiet vai ielīmējiet tekstu, kuru vēlaties runāt redaktorā. Kokoro efektīvi apstrādā garas ejas, pateicoties tās vieglajam 82M-parametram, tuvu reālā laika dzinējam.

  4. 4

    Regulēt ātrumu un ģenerēt

    Iestatiet atskaņošanas ātrumu, lai atbilstu jūsu lietošanas gadījumā, tad noklikšķiniet uz Generate. Kokoro padara audio ātrāk nekā reālā laikā, tāpēc jūsu runa ir gatava gandrīz nekavējoties.

  5. 5

    Lejupielādēt vai izmantot API

    Lejupielādēt pabeigtu audio kā MP3 vai WAV, vai automated generāciju, izmantojot TextToSpeechAI REST API pieapi.texttospeechai.com partijas un reālā laika darba slodzes.

Kokors API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro sniedz dabas runu ar neticamu ātrumu un efektivitāti.",
    "voice": "en_US-lessac-medium"
  }'

Bieži uzdoti jautājumi

Kokoro ir īpaši viegla teksta-no-speech modelis ar tikai 82 miljoniem parametru. Neskatoties uz tā mazo izmēru, tas rada dabīgi skaņu runu vairākās valodās, gandrīz reālā laikā ātrumu, pat ar CPU.

Jā, Kokoro ir pilnībā Apache 2.0 licencēts - gan kods, gan modeļa svars. To var brīvi izmantot komerciālos lietojumos bez ierobežojumiem.

Kokoro atbalsta angļu valodu (ASV un britu), franču, spāņu, hindi, japāņu, ķīniešu, itāļu, portugāļu un korejiešu valodu.

Kokoro ir viens no ātrākajiem TTS modeļiem, kas ir pieejami. Tas rada runu ātrāk nekā reāllaika atskaņošanas ātrumu pat ar CPU, padarot to ideāli piemērotu interaktīvām lietojumprogrammām.

Nē, Kokoro neatbalsta balss klonēšanu. Tā izmanto kūrētu balss bibliotēku ar balss sajaukšanas iespējām. Balss klonēšanai, F5-TTS, Chatterbox, StyleTTS2, OpenVoice vai Tortoise.

Kokoro var kombinēt divas balsis kopā, lai izveidotu unikālas kombinācijas. Tas ļauj jums radīt pielāgotus balss parametrus bez tradicionālās balss klonēšanas.

Abi modeļi ir ātri, viegli. Kokoro ir modernāka arhitektūra un atbalsta balss sajaukšanu, bet Piper ir lielāka balss bibliotēka. Abi ir lieliski reāllaika lietojumiem.

Kokoro ir paredzēts, lai darbotos ar CPU un prasa minimālus resursus - aptuveni 300MB. Nav GPU ir nepieciešams, lai gan GPU paātrinājums tiek atbalstīts vēl ātrākai apstrādei.

Jā. Kokoro ģenerē runu ātrāk nekā atskaņošanu pat CPU, ar ļoti zemu latentumu, tāpēc tas ir lielisks piemērots tērzēšanas robotiem, balss asistentiem, un tiešraides straumēšanu. Tās 82M-parametra izmērs uztur atmiņu izmantot mazs, padarot to praktiski lielu apjomu un malu izvēršanai.

Balss sajaukšana ļauj sajaukt divas Kokoro balsis kopā, lai izveidotu unikālu kombināciju ar pielāgotu raksturu. Tā nav tradicionāla balss klonēšana - jūs nevarat atveidot kādu konkrētu personu no parauga, bet tā sniedz daudzveidīgāku informāciju nekā fiksēta balss bibliotēka. Jūs varat eksperimentēt ar maisījumiem tieši TextToSpeechAI redaktorā.

Abi ir ātri, CPU draudzīgi standarta līmeņa dzinēji bez balss klonēšanas. Kokoro ir visvieglākais (apmēram 300MB) un atbalsta balss sajaukšanu 9 valodās, savukārt MeloTTS fokusējas uz vairākiem angļu akcentiem un reālā laika daudzvalodu izlaidi. Izvēlieties Kokoro vismazākajai pēdas daļai un sajaukšanai; izvēlieties MeloTTS, kad nepieciešams īpašs akcents.

Kokoro ir standarta līmeņa motors, kas izmaksā 10 kredītus uz 1000 rakstzīmēm - zemākā līmeņa TextToSpeechAI. Jaunie konti saņem 200 bezmaksas kredītus, lai jūs varētu izmēģināt Kokoro bez maksas. Tas padara to par vienu no izmaksu ziņā visefektīvākajiem veidiem, kā radīt augstas kvalitātes runu mērogā.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokors Now

Generate your first audio free. No credit card required.

Start Free