Kore

Premium

Izrazni govor AI z čustvi in zvočnimi učinki

Slow Hitrost
Very Good Kakovost
Ne Kloniranje
13 Jeziki

O projektu Kore

Bark je transformatorski tekst-to-audio model, ki lahko ustvarijo zelo izrazit govor z čustvi, smeh, vzdihi in drugimi neverbalnimi zvoki. Za razliko od tradicionalnih TTS, Bark razume kontekst in lahko ustvarja govor, ki se zveni resnično ekspresivno in človeško podobno. Podpira več jezikov in lahko celo ustvarja glasbo in zvočne učinke.

Ključne lastnosti

Čustveno izražanje

Ustvarite govor z smehom, vzdihom, gastronom in pravimi čustvi.

Označevalci čustev

Uporabite [smeh], [vzdihi], CAPS za poudarek in... za oklevanje.

Večjezična

Podpira 13+ jezike z naravnimi naglasi in izgovorom.

Glasba in učinki

Lahko ustvari preprosto glasbo in okoljske zvoke.

Predpostavke zvočnika

Več predurjeni zvočniški glasovi z različnimi stili.

Odpri vir

MIT licencirano s pravicami do polne komercialne uporabe.

Uporabne primere

Pogovorno okno znakov Animirana vsebina Audiobook Narration Igranje glasu Ustvarjalni projekti Izjemni pomočniki

Kore Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Kako uporabljati Kore

  1. 1

    Vpišite se brezplačno in odprite demo

    Ustvarite brezplačno TextToSpeechAI račun, da zahtevate svoje starter kredite, ali uporabite brez podpisa demo, da poskusite Bark takoj. Brezplačni krediti so dovolj za ustvarjanje več ekspresivnih Bark klipi, preden nadgradnjo.

  2. 2

    Izberi glas za barko

    Odprite glasovno knjižnico in izberite Bark zvočnik nastavitev, ki ustreza tonu, ki ga želite. Bark glasovi so označeni kot premium list (25 kreditov na 1000 znakov) in so nastavljeni za čustveno, karakter-stil narration.

  3. 3

    Vnesite besedilo z oznakami čustev

    Vpišite svoj scenarij in vklenite Bark znake čustev: [smeh] za smeh, [vzdihi] za vzdih, [gasps] za gasps,... za pavzo in CAPS za poudarek. Na primer: "Oh wow! [smeh] To je nečutno... Ne morem verjeti! "

  4. 4

    Ustvari zvok

    Kliknite Način in Bark izdeluje vaše besedilo v izrazit govor, spreminjanje vsak marker v ujemajoče zvok. Generacija je počasnejša kot lahke motorje zaradi Barkovega transformatorja modela, tako da dovolite nekaj dodatnih sekund v stavek.

  5. 5

    Prenesi ali uporabi API

    Oglejte si rezultat, nato ga prenesete kot MP3, WAV ali OGG. Za avtomatsko Bark v vaši aplikaciji, pokličite TextToSpeechAI API z glasom Bark in enako marker bogato besedilo, da dobite nazaj izražen zvok.

Kore API

Ustvarite govor programsko z uporabo TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "To je neverjetno, samo obožujem tole.",
    "voice": "bark-zh_0"
  }'

Pogosta vprašanja

Bark je tekstovno-na avdio model, ki ga je ustvaril Suno. Za razliko od tradicionalnih TTS sistemov, Bark ustvarja zelo izrazit govor z naravnimi čustvi, smehom, vzdihom in drugimi neverbalnimi zvoki. Lahko celo ustvarja glasbo in zvočne učinke.

Ja, Bark je odprt vir v okviru licence MIT, ki omogoča brezplačno komercialno uporabo. Na TextToSpeechAI, zaračunamo 25 kreditov na 1000 znakov zaradi pomembnih sredstev GPU, ki so potrebni za proizvodnjo.

Bark podpira 13+ jezikov, vključno angleščine, nemščine, španske, francoščine, hindi, italijanščine, japonske, korejske, poljščine, portugalščine, ruščine, turščine in kitajske. Vsak jezik ima naravno izgovor in naglas.

Bark je počasnejši od večine TTS motorjev zaradi svoje avtoregresivne transformator arhitekture. Tipično stavek traja 5-15 sekund, da se generira na GPU. Tradeff je bistveno bolj izrazit in naravna izhod.

Bark ponuja le omejeno kloniranje glasu z "semantičnimi pohiti" in prednastavki zvočnika, tako da ne more zanesljivo klonirati samovoljnega glasu iz vzorca. Če je polno kloniranje glasu cilj, uporabite F5-TTS, StyleTTS2, OpenVoice ali Tortoise, vse na TextToSpeechAI.

Bark bere vhodne markere, ki so postavljene neposredno v tvojem besedilu, in jih spremeni v enake zvoke. Uporabite [smeh] za smeh, [vzdihne] za vzdih, [gasps] za gasps,... za obotavljanje ali pavzo, in CAPS za poudarek. Primer: "Oh wow! [smeh] To je neverjetno... Ne morem verjeti! "

Bark lahko poleg navadnega govora ustvari neverbalne zvoke kot smeh, vzdihi, gasps, razpršenost grla in mucanje, plus preprosta glasba in vplivi na okolje. Ti so sprožili z markerji, kot so [smeh], [vzdihi] in [gasps] vgrajeni v besedilo, kar je tisto, kar Bark počuti bolj izrazito kot standardni TTS.

Bark proizvaja zelo kakovosten zvok z naravno ekspresivnostjo, ki nasprotuje človeški govor za čustveno vsebino. Izhod 24kHz zveni profesionalno, čeprav čista kakovost govora je nekoliko pod StyleTTS2.

Bark zahteva 8-12GB VRAM odvisno od velikosti modela. Celoten model potrebuje ~12GB, medtem ko manjše variante deluje z 8GB. Preverjanje CPU je izjemno počasen in ni priporočljivo.

Ja, Bark je licenca MIT, ki omogoča neomejeno komercialno uporabo brez licenciranja pristojbin. Bark lahko uporabljate v izdelkih, storitvah in aplikacijah. Na TextToSpeechAI lahko Bark brezplačno poskusite z uporabo svojih prijavnih kreditov, preden plačate več.

Bark je izjemno izrečen v izraženem enogovornem govoru z znaki čustev kot sta [smeh] in [vzdihi], medtem ko je Dia zgrajena za večgovorniški dialog z [S1] / [S2] zavoji in neverbalne napise. Izberite Bark za čustvene narati in karakter glas, in Dia za zadnja in zadnja pogovora. Oba sta na voljo na TextToSpeechAI.

Bark je edinstvena v svoji sposobnosti ustvarjanja resnično izraziti govor z čustvi in neverbalnimi zvoki. Je počasnejši kot drugi motorji, vendar ustvarja bolj človeške rezultate za ustvarjalno vsebino. Za hitrejše sintezo, uporabi Piper. Za kloniranje glasu, uporabite F5-TTS ali OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Kore Now

Generate your first audio free. No credit card required.

Start Free