Kokoro

Standard

Žaibo greitai, lengvas TTS su natūralia kokybe

Very Fast Greitis
Good Kokybė
Ne Klonavimas
9 Kalbos

Apie Kokoro

Kokoro yra itin lengvas 82M parametras TTS modelis, kuris suteikia natūralų garsą neįtikėtinu greičiu. Jis veikia beveik realiu laiku net naudojant procesorių, todėl idealiai tinka programoms, kuriose žemas latentiškumas yra labai svarbus. Kokoro palaiko kelias kalbas ir siūlo balso derinimo galimybes.

Pagrindinės savybės

Galinis šviesos svoris

82M parametrai, ~300MB modelio dydis. Vykdo CPU su minimaliais ištekliais.

Artimas tikrasis laikas

Generuoja kalbą greičiau nei grojimo greitis, net ir be GPU pagreitis.

Daugiakalbiai

Parama anglų, prancūzų, ispanų, Hindi, japonų, kinų, italų, portugalų, ir korėjiečių.

Balso derinimas

Sumaišykite du balsus kartu, kad sukurtumėte unikalius balso derinius.

Naudoti atvejus

Realaus laiko pokalbių robotai ir virtualieji asistentai Gyvai srautinis tekstas į speech Krašto diegimas ir mobiliosios programos Didelio tūrio siuntų apdorojimas

Kaip vartoti Kokoro

  1. 1

    Užsiregistruoti nemokamai arba išbandyti demo

    Sukurti nemokamą TextToSpeechAI paskyra gauti 200 starterio kreditus, arba naudoti no-Signup demo išgirsti Kokoro iš karto. Standartas lygis reiškia, Kokoro tik kainuoja 10 kreditai iš 1000 simbolių.

  2. 2

    Pasirinkite Kokoro balsą

    Atidarykite balso naršyklę ir pasirinkite Kokoro balso pasirinkimą tiksline kalba (9 palaikomas, nuo anglų iki japonų ir korėjiečių). Taip pat galite naudoti Kokoro balso maišymą, kad įmaišytumėte du balsus į pasirinktinį kombinaciją.

  3. 3

    Įveskite savo tekstą

    Įveskite arba įklijuokite tekstą norite kalbėti į redaktorių. Kokoro tvarko ilgas praėjimas efektyviai dėka savo lengvas 82M-parametras, šalia realiu laiku variklis.

  4. 4

    Keisti greitį ir generuoti

    Nustatykite grojimo greitį, kad atitiktų jūsų naudojimo atvejį, tada spustelėkite Generate. Kokoro daro garso greičiau nei realiu laiku, todėl jūsų kalba yra pasirengusi beveik nedelsiant.

  5. 5

    Atsisiųsti arba naudoti API

    Atsisiųskite baigtą garsą kaip MP3 arba WAV, arba automate generaciją per TextToSpeechAI REST API ne api.textospeechai.com serijos ir realaus laiko darbo krūvius.

Kokoro API

Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro suteikia natūralią kalbą neįtikėtinu greičiu ir efektyvumu.",
    "voice": "en_US-lessac-medium"
  }'

Dažnai užduodami klausimai

Kokoro yra itin lengvas teksto į-speech modelis, turintis tik 82 mln. parametrų. Nepaisant jo mažo dydžio, jis gamina natūralų garsų kalbą keliomis kalbomis beveik realiu laiku, net naudojant CPU.

Taip, Kokoro yra visiškai Apache 2.0 licencijuotas - tiek kodas, tiek modelio svoris.Jis gali būti laisvai naudojamas komercinėms reikmėms be apribojimų.

Kokoro palaiko anglų kalbą (JAV ir britų), prancūzų, ispanų, hindi, japonų, kinų, italų, portugalų, korėjiečių.

Kokoro yra vienas iš greičiausių TTS modelių, kuris sukuria kalbą greičiau nei realaus laiko realaus laiko skambėjimo greitį net ir naudojant CPU, todėl idealiai tinka interaktyvioms aplikacijoms.

Ne, Kokoro nepalaiko balso klonavimo. Ji naudoja kuruotą balso biblioteką su balso derinimo galimybėmis. Balso klonavimui, F5-TTS, Chatterbox, StyleTTS2, OpenVoice, arba Tortoise.

Kokoro gali maišyti du balsus kartu, kad sukurtumėte unikalius derinius. Tai leidžia sukurti pasirinktines balso savybes be tradicinių balso klonavimo.

Abu modeliai yra greiti, lengvi. Kokoro turi modernesnę architektūrą ir palaiko balso maišymą, o Piper turi didesnę balso biblioteką. Abu puikiai tinka realiu laiku taikomoms programoms.

Kokoro yra skirtas veikti naudojant CPU ir reikalauja minimalių išteklių - apie 300MB. GPU nėra būtina, nors GPU greitesnis palaikomas dar greitesnis apdorojimas.

Taip. Kokoro generuoja kalbą greičiau nei groti net CPU, su labai mažai latentiškumo, todėl tai yra puikus tinka pokalbių robotai, balso asistentai, ir gyvas srautinis. Jo 82M parametro dydis palaiko atmintį naudoti mažytį, todėl tai praktiška didelio tūrio ir krašto diegimo.

Balso maišymas leidžia sumaišyti du Kokoro balsus kartu, siekiant sukurti unikalų derinį su individualiomis savybėmis. Tai nėra įprasta balso klonavimas - negali atgaminti konkretaus asmens iš pavyzdžio, - tačiau jis suteikia jums daugiau įvairovės nei fiksuota balso biblioteka. Galite eksperimentuoti su mišiniais tiesiogiai TextToSpeechAI redaktoriuje.

Abu yra greiti, CPU draugiški standartinio lygio varikliai be balso klonavimo. Kokoro yra lengviausias (apie 300MB) ir palaiko balso maišymą 9 kalbomis, o MeloTTS yra orientuotas į kelis anglų akcentus ir realiu laiku daugiakalbę išvestį. Pasirinkite Kokoro mažiausiam pėdsakui ir maišymui; pasirinkite MeloTTTS, kai reikia konkrečių akcentų.

Kokoro yra standartinis variklis, kainuojantis 10 kreditų iš 1000 simbolių - žemiausia pakopa TextToSpeechAI. Naujos sąskaitos gauna 200 nemokamai kreditus, todėl galite išbandyti Kokoro nemokant. Tai daro tai vienas iš ekonomiškai efektyviausių būdų sukurti aukštos kokybės kalbą mastu.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokoro Now

Generate your first audio free. No credit card required.

Start Free