Kóreasouthamerica. kgm

Standard

Lightning-fljótur, léttur TTS með náttúrulegum gæðum

Very Fast Hraði
Good Gæði
Nei Klóna
9 Tungumál

Um Kóreasouthamerica. kgm

[Translation temporarily unavailable. Please try again.]

Lykilatriði

Ultra léttur

82M breytur, ~ 300MB líkan stærð. Keyrir á CPU með lágmarks auðlindir.

Næstum rauntíma

Býr til tal hraðar en spilunarhraði, jafnvel án GPU hröðunar.

Fjöltyng

Styður ensku, frönsku, spænsku, hindí, japönsku, kínversku, ítalska, portúgölsku og kóresku.

Rödd

Blandaðu tveimur röddum saman til að búa til einstaka raddsamsetningar.

Nota tilfelli

Rauntíma spjallforrit og sýndaraðstoðarmenn Lifandi streymi texta-í-tal Edge dreifing og farsímaforrit High-volume hópur vinnsla

Hvernig á að nota Kóreasouthamerica. kgm

  1. 1

    Skráðu þig ókeypis eða prófaðu kynninguna

    Búðu til ókeypis TextToSpeechAI reikning til að fá 200 upphafspunkta eða notaðu ekki skráningarsýninguna til að heyra Kokoro strax.Standard stigið merkir að Kokoro kostar aðeins 10 einingar á 1000 stafi.

  2. 2

    Veldu Kokoro rödd

    Opnaðu raddvafrann og veldu Kokoro rödd á markmálinu þínu (9 studd, frá ensku til japönsku og kóresku).Þú getur líka notað Kokoro rödd blöndu til að blanda tveimur raddir í sérsniðna samsetningu.

  3. 3

    Sláðu inn textann þinn

    Sláðu inn eða límdu textann sem þú vilt tala í ritstjórann. Kokoro meðhöndlar langar kafla á skilvirkan hátt þökk sé léttum 82M-breytu, nálægt rauntímavél.

  4. 4

    Stilla hraða og búa til

    Stilltu spilunarhraða til að henta notkunartilfelli þínu og smelltu síðan á Búa til. Kokoro gerir hljóð hraðar en rauntíma, þannig að ræðan þín er tilbúin næstum strax.

  5. 5

    Hlaða niður eða nota API

    Hladdu niður fullunnum hljóð sem MP3 eða WAV, eða sjálfvirkt að mynda í gegnum TextToSpeechAI REST API á api.texttospeechai.com fyrir lotu og rauntíma vinnuálag.

Kóreasouthamerica. kgm API

Búa til ræðu forritunarlega með TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro skilar náttúrulegum ræðu með ótrúlegum hraða og skilvirkni.",
    "voice": "en_US-lessac-medium"
  }'

Algengar spurningar

Kokoro er mjög léttur texti-til-tal líkan með aðeins 82 milljón breytur.Þrátt fyrir litla stærð sína, framleiðir það náttúrulega hljómandi ræðu á mörgum tungumálum á nálægum rauntíma hraða, jafnvel á CPU.

Já, Kokoro er fullkomlega Apache 2.0 leyfi - bæði kóða og líkan þyngd.Það má nota frjálslega í viðskiptalegum forritum án takmarkana.

Kokoro styður ensku (US og British), frönsku, spænsku, hindí, japönsku, kínversku, ítalska, portúgölsku og kóresku.

Kokoro er einn af hraðasta TTS módel í boði.Það býr til tal hraðar en rauntíma spilunarhraða jafnvel á CPU, sem gerir það tilvalið fyrir gagnvirk forrit.

Nei, Kokoro styður ekki raddklóðun. Það notar sérstakt raddsafn með raddblöndunarmöguleikum. Til raddklóðunar skaltu nota F5- TTS, Chatterbox, StyleTTS2, OpenVoice eða Tortoise.

Kokoro getur blandað tveimur raddir saman til að búa til einstaka samsetningar.Þetta gerir þér kleift að búa til sérsniðna radd eiginleika án hefðbundinnar radd klónun.

Báðar eru þær hraðar og léttar. Kokoro er með nútímalegri uppbyggingu og styður raddblöndu en Piper hefur stærra raddsafn. Báðar eru þær frábærar fyrir rauntímaforrit.

Kokoro er hannað til að keyra á CPU og krefst lágmarks auðlindir - um það bil 300MB.Engin GPU er þörf, þó GPU hröðun er studd fyrir jafnvel hraðari vinnslu.

Já. Kokoro býr til tal hraðar en spilun jafnvel á CPU, með mjög litlum leynd, þannig að það er frábært passa fyrir chatbots, radd aðstoðarmenn, og lifandi streymi. 82M-breytu stærð hennar heldur minni notkun lítill, sem gerir það hagnýt fyrir mikið magn og brún dreifingu.

Með raddblöndu er hægt að blanda tveimur Kokoro röddum saman til að búa til einstaka samsetningu með sérsniðnum eiginleikum. Þetta er ekki hefðbundin raddklóðun - þú getur ekki endurskapað tiltekna manneskju úr sýni - en það gefur þér meiri fjölbreytni en fast raddsafn. Þú getur prófað með blöndum beint í TextToSpeechAI ritlinum.

Báðir eru þeir hraðir, CPU- vingjarnlegir staðal- vélbúnaðarvélar án raddklóningar. Kokoro er léttasti (um 300MB) og styður raddblöndu á 9 tungumálum, en MeloTTS einbeitir sér að mörgum enskum hreim og rauntíma fjöltyngdu úttaki. Veldu Kokoro fyrir minnsta fótspor og blöndu; veldu MeloTTS þegar þú þarft sérstakar hreim.

Kokoro er staðal-stig vél, kostar 10 einingar á 1000 stafi - lægsta stigi á TextToSpeechAI. Nýir reikningar fá 200 ókeypis einingar, svo þú getur prófað Kokoro án þess að borga.Þetta gerir það einn af hagkvæmustu leiðir til að búa til hágæða ræðu á mælikvarða.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kóreasouthamerica. kgm Now

Generate your first audio free. No credit card required.

Start Free