Žievės

Premium

Išreikšta AI kalba su emocijomis ir sveiku poveikiu

Slow Greitis
Very Good Kokybė
Ne Klonavimas
13 Kalbos

Apie Žievės

Barkas yra transformatorius grindžiamas tekstu įaudio modelis, kuris gali sukurti labai išraiškingą kalbą su emocijomis, juokdariu, siūti ir kitais neverbaliniais garsais. Skirtingai nuo tradicinių TTS, Barkas supranta kontekstą ir gali sukurti kalbą, kuri skamba tikrai išraiškingai ir kaip žmogus. Ji palaiko kelias kalbas ir gali net sukurti muzikos ir garso efektus.

Pagrindinės savybės

Emocinė išraiška

Generuokite kalbą juokdariu, siūbuodami, purkšdami, ir tikros emocijos.

Emociniai žymikliai

Naudokite [skerdyklą], [sudūs], CAPS akcentuoti ir... dvejonių.

Daugiakalbis

Parama 13+ kalbų su natūraliais akcentais ir tarimas.

Muzika ir efektai

Gali sukurti paprastą muziką ir aplinkos garsus.

Garsiakalbių nustatymai

Keli iš anksto išmokyti garsiakalbiai su skirtingų stilių.

Atverti šaltinį

MIT, turintis visas komercinio naudojimo teises.

Naudoti atvejus

Simbolių dialogas Animuotas turinys Garso knygos naracija Žaidimo balsas Kūrybiniai projektai Išreikšti padėjėjai

Žievės Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Kaip vartoti Žievės

  1. 1

    Užsiregistruoti nemokamai ir atidaryti demo

    Sukurti nemokamą TextToSpeechAI paskyrą reikalauti savo starterio kreditus, arba naudoti no-signup demo išbandyti bark iš karto. Nemokamas kreditai yra pakankamai, kad generuoti keletą išraiškingų Bark klipus prieš atnaujinant.

  2. 2

    Pasirinkite aikštę

    Atidarykite balso biblioteką ir pasirinkite Bark garsiakalbio iš anksto nustatytą, kuris atitinka norimą toną. Barkų balsai yra pažymėti kaip aukščiausios klasės (25 kreditai 1000 simbolių) ir yra pritaikytas emocinio, charakterio stiliaus narracija.

  3. 3

    Įveskite tekstą su emocijų žymekliais

    Įveskite savo scenarijų ir embed Bark emocijų žymenys į eilę: [skerdyklą] juokai, [sukite] už sijuosti, [sudušę] už gamtas,... už pauzę, ir CAPS akcentas. Pavyzdžiui: "Oho! [skerdyklė] Tai yra AMAZING... Aš negaliu patikėti!"

  4. 4

    Generuoti garsą

    Spustelėkite Generuoti ir barkas paverčia jūsų tekstą išraiškinga kalba, paverčiant kiekvieną žymeklį į atitikimo garsą. Generacija yra lėtesnė nei lengvi varikliai, nes Bark transformatoriaus modelis, todėl leisti keletą papildomų sekundžių sakinyje.

  5. 5

    Atsisiųsti arba naudoti API

    Peržiūrėti rezultatą, tada parsisiųsti jį kaip MP3, WAV, arba OGG. Automate Bark savo app, skambinkite TextToSpeechAI API su Bark balso ir to paties žymeklio daug tekstą, kad atgauti išraiškingą garsą.

Žievės API

Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Oho, tai nuostabu, kad aš tik myliu, kaip tai skamba!",
    "voice": "bark-zh_0"
  }'

Dažnai užduodami klausimai

Barkas yra transformatoriaus paremtas tekstu įaudio modelis, sukurtas Suno. Skirtingai nuo tradicinių TTS sistemų, barkas generuoja labai išraiškingą kalbą su natūraliomis emocijomis, juokdariu, siūti ir kitų neverbalinių garsų. Jis gali net sukurti muzikos ir garso efektai.

Taip, Bark yra atviras šaltinis pagal MIT licenciją, leidžia nemokamas komercinis naudojimas. TextToSpeechAI, mes apmokestiname 25 kreditus už 1000 simbolių, nes didelių GPU išteklių reikia gamybai.

Barkas palaiko 13+ kalbų, įskaitant anglų, vokiečių, ispanų, prancūzų, hindi, Italijos, Japonijos, Korėjos, Lenkijos, Portugalijos, Rusijos, Turkijos ir kinų. Kiekviena kalba turi natūralų tarimas ir akcentai.

Kietas yra lėtesnis nei dauguma TTS variklių dėl savo autoregesyvių transformatorių architektūrą. Tipinis sakinys trunka 5-15 sekundžių generuoti GPU. Komplektas yra žymiai išraiškingesnis ir natūralus išeiga.

Barkas siūlo tik ribotą balso klonavimo per "semantiškas pavaras" ir garsiakalbis iš anksto nustatyti, todėl jis negali patikimai klonuoti savavališką balso iš pavyzdžio. Jei visas balso klonavimo yra jūsų tikslas, naudoti F5-TTS, StyleTTS2, OpenVoice, arba Tortoise vietoj, visi prieinami TextToSpeechAI.

Barkas skaito intraline žymenys tiesiai į savo tekstą ir paverčia juos atitikimo garsai. Naudokite [skerdykla] juokus, [sudūsta] už smygus, [sudušę] už gamas,... dvejonių ar pauzės, ir CAPS akcentas. Pavyzdžiui: "O wow! [skerdyklė] Tai yra Siaubas... Aš negaliu patikėti!"

Be paprastos kalbos, barkas gali sukelti neverbalinius garsus, kaip juokus, sijuolius, ūsus, gerklės nuvalymą, ir paprastą muziką bei poveikį aplinkai. Tai yra aktyvuojama žymekliai, pavyzdžiui, [suaugęs], [suarai] ir [sugeriami] tekste, todėl Barkas jaučiasi išraiškingesnis už standartinius TTS.

Barkas gamina labai geros kokybės garsą su natūraliu išraiškingumu, kuris konkuruoja žmogaus kalbą emocinio turinio. 24kHz išvestis skamba profesionaliai, nors gryna kalbos kokybė yra šiek tiek žemiau Styletts2.

Skalūnas reikalauja 8-12GB VRAM priklausomai nuo modelio dydžio. Visiškam modeliui reikia ~12GB, o mažesni variantai veikia su 8GB. Procesoriaus išėjimas yra labai lėtas ir nerekomenduojamas.

Taip, Bark yra MIT licencijuotas, kuris leidžia nevaržomą komercinį naudojimą be licencijos mokesčių. Galite laisvai naudoti Bark produktų, paslaugų, ir programų. TextToSpeechAI galite išbandyti Bark nemokamai naudojant savo registracijos kreditus prieš mokėdami už daugiau.

Barkas puikiai išraiškingas vienkalbis kalba su emocijomis, pvz., [skerdyne] ir [su artimaisiais], o Dia yra sukurtas daugiakalbiam dialogui su [S1]/[S2] posūkiais ir neverbaliniais kubeliais. Pasirinkite Barką emociniam naracijai ir charakterio balsui, o Dia yra atsarginiams ir trikampiams pokalbiams. Abu galima rasti TextToSpeechAI m.

Barkas yra unikalus savo sugebėjimą generuoti tikrai išraiškingą kalbą su emocijomis ir neverbaliniais garsais. Jis yra lėtesnis nei kiti varikliai, bet sukelia daugiau žmogaus tipo rezultatų kūrybinio turinio. Greičiau sintezės, naudoti Piper. Dėl balso klonavimo, naudoti F5-TTS arba OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Žievės Now

Generate your first audio free. No credit card required.

Start Free