Kuori

Premium

Ilmeinen tekoälyn puhe tunteineen ja äänitehosteineen

Slow Nopeus
Very Good Laatu
Ei tarvitse. Kloonaus
13 Kielet

Tietoja Kuori

Bark on muuntajapohjainen teksti-audio-malli, joka voi tuottaa erittäin ilmaisuvoimaista puhetta tunteilla, naurulla, huokauksilla ja muilla ei-verbaalisilla äänillä. Toisin kuin perinteinen TTS ymmärtää kontekstia ja voi tuottaa puhetta, joka kuulostaa aidosti ilmaisuvaltaiselta ja inhimilliseltä. Se tukee useita kieliä ja voi jopa tuottaa musiikkia ja ääniefektejä.

Tärkeimmät ominaisuudet

Tunteellinen ilmaisu

Luo puhetta nauramalla, huokailemalla, huokailemalla ja aidoilla tunteilla.

Tunteiden merkit

Käytä CAPSia painotukseen ja epäröintiin.

Monikielinen

Tukee 13+ kieltä luonnollisella korostuksella ja ääntämisellä.

Musiikki ja tehosteet

Voi tuottaa yksinkertaista musiikkia ja ympäristöääniä.

Puheenvuoron esiasetukset

Useita esikoulutettuja kaiutinääniä eri tyyleillä.

Avaa lähdekoodi

MIT:n lisenssi täydellä kaupallisella käyttöoikeudella.

Käytä tapauksia

Luonnedialogi Animoitu sisältö Äänikirjan narratiivi Peliääni toimii Luovia projekteja Ilmeisiä avustajia

Kuori Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Miten sitä käytetään Kuori

  1. 1

    Rekisteröidy ilmaiseksi ja avaa demo

    Luo ilmainen TextToSpeechAI-tili, jolla voit hakea starttitilisi, tai käytä ei-allekirjoittautumisdemoa Barkin kokeilemiseen heti. Ilmaiset krediitit riittävät luomaan useita ilmeikkäitä Bark-leikkeitä ennen päivitystä.

  2. 2

    Valitse Barkin ääni

    Avaa äänikirjasto ja valitse Bark-kaiutin, joka vastaa haluamaasi sävyä. Bark-äänet on merkitty premium-tasoksi (25 krediittiä tuhatta merkkiä kohti), ja ne on viritetty tunteisiin perustuvaan luonnekuvaukseen.

  3. 3

    Syötä teksti tunnemerkeillä

    Kirjoita käsikirjoituksesi ja upota Barkin tunnemerkit riviin: [teurastus] nauruun, [huuteluun] huokailuun, [huuteluun] tauolle, ja CAPS korostukseen. Esimerkiksi: "Voi vau! [teurastus] Tämä on hämmästyttävää... En voi uskoa sitä!"

  4. 4

    Luo ääni

    Click Generate and Bark muuttaa tekstisi ilmaisunomaiseksi puheeksi, jolloin jokainen merkki muuttuu vastaavaksi ääneksi. Barkin muuntajan mallin ansiosta sukupolvi on hitaampi kuin kevyet moottorit, joten anna muutama lisäsekunti lausetta kohti.

  5. 5

    Lataa tai käytä API-rajapintaa

    Esikatsele tulos ja lataa se MP3-na, WAV-na tai OGG-na. Jos haluat automatisoida Barkin omassa sovelluksessasi, soita TextToSpeechAI API:hen Bark-äänellä ja samalla merkkirikkaalla tekstillä, jotta saat takaisin ilmaisevan äänen.

Kuori API

Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Ihanaa, kuinka ilmaisuvaltaiselta tämä kuulostaa.",
    "voice": "bark-zh_0"
  }'

Usein kysyttyjä kysymyksiä

Bark on Sunon luoma muuntajapohjainen teksti-audio-malli. Toisin kuin perinteiset TTS-järjestelmät, Bark tuottaa erittäin ilmaisuvoimaista puhetta, jossa on luonnollisia tunteita, naurua, huokauksia ja muita ei-verbaaleja ääniä. Se voi jopa tuottaa musiikkia ja ääniefektejä.

Kyllä, Bark on MIT-lisenssin mukainen avoin lähdekoodi, joka mahdollistaa ilmaisen kaupallisen käytön. TextToSpeechAI:lla veloitamme 25 opintopistettä tuhatta merkkiä kohti, koska tuotanto vaatii merkittäviä GPU-resursseja.

Bark tukee 13+ kieltä, kuten englantia, saksaa, espanjaa, ranskaa, hindiä, italiaa, japania, koreaa, puolaa, portugalia, venäjää, turkkia ja kiinaa. Jokaisessa kielessä on luonnollinen lausunta ja korostus.

Bark on hitaampi kuin useimmat TTS-moottorit autoregressiivisen muuntajaarkkitehtuurin ansiosta. Tyypillinen lause kestää 5-15 sekuntia GPU:n tuottamiseen. Vaihtokauppa on huomattavasti ilmaisukykyisempi ja luonnollisempi.

Bark tarjoaa vain rajoitetun äänikloonauksen "semanttisten vihjeiden" ja kaiuttimien kautta, joten se ei voi luotettavasti kloonata mielivaltaista ääntä näytteestä. Jos täysäänikloonaus on tavoitteesi, käytä F5-TTS:ää, Styletts2:ta, OpenVoicea tai Tortoisea, kaikki saatavilla TextToSpeechAI:lla.

Bark lukee tekstiisi suoraan sijoitettuja inline-merkkejä ja muuttaa ne vastaaviksi ääniksi. Käytä [teurastamista] nauramiseen, [huutelua] huokailuun, [huutelua] epäröintiin tai tauolle, ja CAPS korostamiseen. Esimerkki: "Voi vau! [teurastamista] Tämä on hämmästyttävää... En voi uskoa sitä!"

Pelkkää puhetta lukuun ottamatta Bark voi tuottaa ei-sanallisia ääniä, kuten naurua, huokauksia, huokauksia, kurkunpuhdistusta ja änkytystä sekä yksinkertaista musiikkia ja ympäristövaikutuksia. Nämä laukeavat merkkiaineilla, kuten [teurastuksella], [hulkulla] ja [huljulla], jotka ovat osa tekstiä, mikä saa Barkin tuntemaan itsensä ilmaisukykyisemmäksi kuin tavallinen TTS.

Bark tuottaa erittäin laadukasta ääntä luonnollisella ilmaisukyvyllä, joka kilpailee ihmisen puheen tunnesisällön kanssa. 24kHz:n ulostulo kuulostaa ammattimaiselta, vaikka puheen laatu on hieman Styletts2:n alapuolella.

Bark vaatii 8-12GB VRAM-muistia mallikoon mukaan. Täysi malli tarvitsee ~12GB:n, kun taas pienemmät versiot toimivat 8GB:n kanssa. CPU-päätelmä on erittäin hidas eikä sitä suositella.

Kyllä, Bark on MIT-lisensioitu, ja se sallii rajoittamattoman kaupallisen käytön ilman lisenssimaksuja. Barkia voi käyttää tuotteissa, palveluissa ja sovelluksissa vapaasti. TextToSpeechAI:sta voit kokeilla Bark free -palvelua ilmoittautumisluottojen avulla ennen kuin maksat lisää.

Bark on erinomainen ilmaisemaan yksiäänistä puhetta, jossa on tunnemerkkejä, kuten [teurastus] ja [höpöttelyä], kun taas Dia on rakennettu monikielistä vuoropuhelua varten [S1]/[S2]-käännösten ja ei-sanallisten merkkien kanssa. Valitse Bark emotionaalista kerrontaa ja luonneääntä varten sekä Dia-käännöksiä varten. Molemmat ovat saatavilla TextToSpeechAI:lla.

Bark on ainutlaatuinen siinä, että se pystyy tuottamaan aidosti ilmaisukykyistä puhetta tunteilla ja ei-sanallisilla äänillä. Se on hitaampi kuin muut moottorit, mutta tuottaa ihmismäisempiä tuloksia luovaan sisältöön. Nopeampaan synteesiin käytä Piperia. Äänikloonaukseen käytä F5-TTS:ää tai OpenVoicea.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Kuori Now

Generate your first audio free. No credit card required.

Start Free