Puukoor

Premium

Ekspressiivne tehisintellektikõne emotsioonide ja heliefektidega

Slow Kiirus
Very Good Kvaliteet
Ei. Kloonimine
13 Keeled

Info Puukoor

Bark on trafol põhinev teksti-audio mudel, mis võib tekitada väga väljendusrikast kõnet emotsioonide, naeru, ohkamiste ja muude mitte-verbaalsete helidega. Erinevalt traditsioonilisest TTS-ist mõistab Bark konteksti ja suudab esitada kõnet, mis kõlab tõeliselt väljendusrikkalt ja inimese moodi. See toetab mitut keelt ning võib tekitada isegi muusikat ja heliefekte.

Peamised omadused

Emotsionaalne väljendus

Loo kõne naeru, ohkamiste, ohkamiste ja tõeliste emotsioonidega.

Tundemärgid

Kasutage [naer], [ohkab], CAPS rõhku, ja... kõhkluseks.

Mitmekeelne

Toetab 13+ keelt loomulike aktsentide ja hääldustega.

Muusikaefektid

Võib tekitada lihtsat muusikat ja keskkonnahelisid.

Kõlari seadistused

Mitmed eeltreenitud kõlari hääled erinevate stiilidega.

Avatud lähtekoodiga

MIT litsentseeritud täieliku kaubandusliku kasutusõigusega.

Kasutusklassid

Sümbolidialoog Animeeritud sisu Audioraamat Narration Mäng Hääl Aktiveerimine Loovad projektid Ekspressiivsed assistendid

Puukoor Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Kuidas kasutada Puukoor

  1. 1

    Registreeru tasuta ja ava demo

    Loo tasuta TextToSpeechAI konto nõuda oma starter krediiti, või kasutada no-signup demo proovida Bark kohe. Tasuta krediiti on piisav, et luua mitu ekspressiivne Bark klippe enne uuendada.

  2. 2

    Vali puukoore hääl

    Avage hääleteek ja valige Barki kõlar, mis vastab soovitud toonile. Puukoore hääled on märgistatud premium-tasemena (25 krediiti 1000 tähemärgi kohta) ja häälestatakse emotsionaalseks, iseloomu stiilis jutustamiseks.

  3. 3

    Kirjuta tekst emotsioonimärkidega

    Kirjuta oma skript ja embed Bark emotsioon markerid inline: [naer] naeru, [ohkab] ohkab, [gasps] gasps,... jaoks paus, ja CAPS rõhku. Näiteks: "Oh vau! [naer] See on AMAZING... Ma ei suuda seda uskuda!"

  4. 4

    Audio genereerimine

    Klõpsake Genereeri ja Bark muudab teksti väljendusrikkaks kõneks, muutes iga markeri sobivaks heliks. Klõpsake Barki trafomudeli tõttu on Genereerimine aeglasem kui kerge mootorid, nii et lubage paar lisasekundit lause kohta.

  5. 5

    API allalaadimine või kasutamine

    Eelvaatlus tulemus, siis alla laadida see MP3, WAV, või OGG. Et automatiseerida Bark oma app, helista TextToSpeechAI API Bark hääl ja sama marker-rikas tekst saada tagasi ekspressiivne heli.

Puukoor API

Loo kõne programmiliselt kasutades TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Oh vau! See on hämmastav... ma lihtsalt armastan kui väljendusrikas see kõlab!",
    "voice": "bark-zh_0"
  }'

Korduma kippuvad küsimused

Bark on Suno loodud trafol põhinev teksti-audio mudel. Erinevalt traditsioonilistest TTS-süsteemidest tekitab Bark väga väljendusrikka kõne loomulike emotsioonide, naeru, ohkete ja muude mitteverbaalsete helidega. See võib tekitada isegi muusikat ja heliefekte.

Jah, Bark on avatud lähtekoodiga alusel MIT litsentsi, mis võimaldab tasuta äriotstarbelise kasutamise. TextToSpeechAI, võtame 25 krediiti 1000 tähemärki tõttu oluline GPU ressursse vaja tootmiseks.

Bark toetab 13+ keelt, sealhulgas inglise, saksa, hispaania, prantsuse, hindu, itaalia, jaapani, korea, poola, portugali, vene, türgi ja hiina keelt. Igal keelel on loomulik hääldus ja aktsent.

Bark on aeglasem kui enamik TTS mootorid tänu oma autoregressiivne trafo arhitektuur. Tüüpiline lause võtab 5-15 sekundit, et luua GPU. Backoff on oluliselt ekspressiivne ja loomulik väljund.

Bark pakub ainult piiratud hääl kloonimine läbi "semantiline motivatsioonid" ja kõlar presets, nii et see ei saa usaldusväärselt kloonida suvaline hääl proovi. Kui täielik hääl kloonimine on teie eesmärk, kasutage F5-TTS, StyleTTS2, OpenVoice, või Tortoise asemel, kõik saadaval TextToSpeechAI.

Bark loeb inline markerid paigutatud otse oma teksti ja muudab need sobitamine helid. Kasuta [naer] naeru, [ohkab] ohkab, [gasps] gasps,... kõhkluseks või paus, ja CAPS rõhku. Näide: "Oh vau! [naer] See on AMAZING... Ma ei suuda seda uskuda!"

Lisaks lihtsale kõnele võib Bark tekitada mitteverbaalseid helisid, nagu naer, ohked, ohked, kõri puhastamine ja kogelemised, pluss lihtne muusika ja keskkonnamõjud. Need käivituvad selliste markeritega nagu [tapmine], [ohkab] ja [gasps], mis on teksti sisse põimitud, mis paneb Barki tundma rohkem väljendusrikast kui tavaline TTS.

Bark toodab väga hea kvaliteediga heli loomulik väljendusvõime, mis konkureerib inimese kõne emotsionaalse sisu. 24kHz väljund kõlab professionaalne, kuigi puhas kõne kvaliteet on veidi alla StyleTTS2.

Bark nõuab 8-12GB VRAM sõltuvalt mudeli suurusest. Täielik mudel vajab ~12GB, samas kui väiksemad variandid töötavad 8GB. CPU järeldus on väga aeglane ja ei ole soovitatav.

Jah, Bark on MIT litsentseeritud, mis võimaldab piiramatut ärikasutust ilma litsentsimistasudeta. Võite kasutada Barki tooteid, teenuseid ja rakendusi vabalt. TextToSpeechAI saate proovida Bark tasuta kasutades oma sisselogimiskrediiti, enne kui maksate rohkem.

Bark on silmapaistev väljendusrikas ühehäälne kõne emotsioonide markeritega nagu [naer] ja [ohkab], samas Dia on ehitatud multi-speaker dialoogi [S1] / [S2] pöörded ja mitteverbaalne kiid. Vali Bark emotsionaalne jutustamine ja iseloomu hääl, ja Dia tagasi-ja-forth vestlused. Mõlemad on saadaval TextToSpeechAI.

Puukoor on ainulaadne oma võimes tekitada tõeliselt väljendusrikast kõnet emotsioonide ja mitte-verbaalsete helidega. See on aeglasem kui teised mootorid, kuid annab loomingulise sisu jaoks rohkem inimlikke tulemusi. Kiirema sünteesi jaoks kasuta Piperit. Hääle kloonimiseks kasuta F5-TTS või OpenVoice'i.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Puukoor Now

Generate your first audio free. No credit card required.

Start Free