Kůra

Premium

Expresivní umělá inteligence s emocemi a zvukovými efekty

Slow Rychlost
Very Good Kvalita
Ne. Klonování
13 Jazyky

O aplikaci Kůra

Bark je model založený na transformátoru, který dokáže vytvářet vysoce výraznou řeč s emocemi, smíchem, povzdechem a dalšími neverbálními zvuky. Na rozdíl od tradičního TTS, Bark rozumí kontextu a může vytvářet řeč, která zní skutečně expresivně a jako člověk. Podporuje více jazyků a může dokonce vytvářet hudební a zvukové efekty.

Klíčové funkce

Emocionální vyjádření

Vytvářejte řeč smíchem, vzdechy, vzdechy a opravdovými emocemi.

Emoční značky

Použijte [smích], [povzdechne], CAPS pro důraz, a... pro váhání.

Vícejazyčné

Podporuje 13+ jazyky s přirozeným přízvukem a výslovností.

Hudba a efekty

Může generovat jednoduchou hudbu a zvuky životního prostředí.

Předvolby reproduktorů

Několik předtrénovaných reproduktorů s různými styly.

Otevřít zdroj

MIT licencované s plnými právy na komerční využití.

Pouzdra na použití

Dialog znaků Animovaný obsah Audiobook Narrace Hra Voice Acting Kreativní projekty Expresivní asistenti

Kůra Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Jak se používá Kůra

  1. 1

    Zaregistrujte se zdarma a otevřete demo

    Vytvořte zdarma TextToSpeechAI účet pro nárok na startovací kredity, nebo použijte demo no-signup vyzkoušet Bark hned. Bezplatné kredity jsou dost generovat několik expresivní Bark klipy před upgrade.

  2. 2

    Vyberte si štěk hlas

    Otevřete hlasovou knihovnu a vyberte přednastavený reproduktor Bark, který odpovídá tónu, který chcete. Bark hlasy jsou označeny jako prémiová úroveň (25 kreditů na 1000 znaků) a jsou naladěny pro emocionální, charakter-styl vyprávění.

  3. 3

    Zadejte text s emocemi

    Napiš svůj scénář a založ emoce Bark inline: [smích] pro smích, [povzdechne] pro povzdechy,... pro pauzu, a CAPS pro důraz. Například: "Oh wow! [smích] To je úžasné... Nemůžu tomu uvěřit!"

  4. 4

    Generovat zvuk

    Klepněte na tlačítko Generovat a Bark překreslí váš text do expresivní řeči, otáčení každé značky do odpovídající zvuk. Generace je pomalejší než lehké motory kvůli modelu Bark transformátoru, takže dovolte několik sekund navíc za větu.

  5. 5

    Stáhnout nebo použít API

    Prohlédněte si výsledek, pak jej stáhněte jako MP3, WAV, nebo OGG. Chcete-li automatizovat Bark ve své vlastní aplikaci, zavolejte TextToSpeechAI API s hlasem Bark a stejným textem bohatým na značky získat zpět expresivní zvuk.

Kůra API

Generovat řeč programově pomocí TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Páni! To je úžasné... prostě miluju, jak expresivně to zní!",
    "voice": "bark-zh_0"
  }'

Často kladené otázky

Na rozdíl od tradičních TTS systémů, Bark generuje vysoce výraznou řeč s přirozenými emocemi, smíchem, povzdechem a dalšími neverbálními zvuky. Může dokonce vytvářet hudební a zvukové efekty.

Ano, Bark je open-source pod licencí MIT, což umožňuje bezplatné komerční použití. Na TextToSpeechAI, účtujeme 25 kreditů na 1000 znaků vzhledem k významné GPU zdroje potřebné pro generaci.

Bark podporuje 13+ jazyků včetně angličtiny, němčiny, španělštiny, francouzštiny, hindštiny, italštiny, japonštiny, korejštiny, polštiny, portugalštiny, ruštiny, turečtiny a čínštiny.

Kůra je pomalejší než většina TTS motorů díky své autoregresivní architektuře transformátoru. Typická věta trvá 5-15 sekund generovat na GPU. Odměna je výrazně více expresivní a přirozený výstup.

Bark nabízí pouze omezený hlasový klonování prostřednictvím "sémantické výzvy" a přednastavení reproduktoru, takže nemůže spolehlivě naklonovat libovolný hlas ze vzorku. Pokud je plný hlas klonování je vaším cílem, použijte F5-TTS, StyleTTS2, OpenVoice, nebo Tortoise místo toho, všechny dostupné na TextToSpeechAI.

Bark čte inline značky umístěné přímo ve vašem textu a mění je v odpovídající zvuky. Použijte [smích] pro smích, [povzdechy] pro vzdechy, [vzdechy] pro vzdechy,... pro zaváhání nebo pauzu, a CAPS pro důraz. Příklad: "Oh wow! [smích] To je úžasné... Nemůžu tomu uvěřit!"

Kromě prosté řeči, Bark může produkovat neverbální zvuky jako smích, vzdychy, vzdechy, koktání krku, a koktání, plus jednoduchá hudba a vlivy na životní prostředí. Tyto jsou spuštěny s markery, jako je [smích], [povzdechy], a [vzdechy] vložené v textu, což je to, co dělá Bark cítit více expresivní než standardní TTS.

Bark produkuje velmi kvalitní zvuk s přirozenou expresivitou, která soupeří s lidskou řečí pro emocionální obsah. Výstup 24kHz zní profesionálně, i když čistá kvalita řeči je mírně pod Styletts2.

Bark vyžaduje 8-12GB VRAM v závislosti na velikosti modelu. Plný model potřebuje ~12GB, zatímco menší varianty pracují s 8GB. CPU inference je extrémně pomalá a nedoporučuje se.

Ano, Bark má licenci MIT, která umožňuje neomezené komerční využití bez licenčních poplatků. Můžete použít Bark v produktech, službách a aplikacích zdarma. Na TextToSpeechAI můžete vyzkoušet Bark zdarma pomocí vašich přihlašovacích kreditů před zaplacením více.

Bark vyniká v expresivní jednoslovné řeči s emocemi, jako je [smích] a [povzdechne], zatímco Dia je postavena pro multi-speaker dialog s [S1]/[S2] zatáčky a neverbální narážky. Vyberte si Bark pro emocionální vyprávění a charakterový hlas, a Dia pro back-a-forth konverzace. Oba jsou k dispozici na TextToSpeechAI.

Bark je jedinečný ve své schopnosti generovat skutečně expresivní řeč s emocemi a non-verbální zvuky. Je pomalejší než jiné motory, ale produkuje více lidských-jako výsledky pro tvůrčí obsah. Pro rychlejší syntézu, použijte Piper. Pro klonování hlasu, použijte F5-TTS nebo OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Kůra Now

Generate your first audio free. No credit card required.

Start Free