miza

Premium

Izteiksmīga AI runa ar emocijām un skaņas efektiem

Slow Ātrums
Very Good Kvalitāte
Klonēšana
13 Valodas

Par miza

Barks ir transformatoru balstīts teksts uzaudio modeli, kas var radīt ļoti izteiksmīgu runu ar emocijām, smiekliem, smiņām un citām neverbālām skaņām. Atšķirībā no tradicionālām TTS, Barks saprot kontekstu un var radīt runu, kas izklausās patiesi izteiksmīgs un cilvēcīgi līdzīgs. Tas atbalsta vairākas valodas un var pat radīt mūziku un skaņas efektus.

Galvenās iezīmes

Emocionāla izteiksme

Radiet runu ar smiekliem, smiņām, ķieģeļiem un reālām emocijām.

Emocijas marķieri

Izmantojiet [meitnieks], [siti], CAPS par uzsvaru, un... par vilšanos.

Daudzvalodīgi

Atbalsta 13+ valodas ar dabiskiem akcentiem un izrunu.

Mūzika un efekti

Var radīt vienkāršu mūziku un vides skaņas.

Skaļruņu priekšsesti

Vairāki iepriekš apmācīti runātāju balsis ar dažādiem stiliem.

Atvērt avotu

MIT, kam ir izsniegtas visas komerciālās izmantošanas tiesības.

Lietot gadījumus

Rakstzīmju dialogs Animēts saturs Audiogrāmatu narācija Spēles balss rīkojas Radošie projekti Izteiksmīgi palīgi

miza Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Kā lietot miza

  1. 1

    Pierakstīties bezmaksas un atvērt demo

    Izveidot bezmaksas TextToSpeechAI konts, lai pieprasītu savu startera kredītus, vai izmantot no-signup demo, lai mēģinātu bark uzreiz. Bezmaksas kredīti ir pietiekami, lai radītu vairākas izteiksmīgs bark klipus pirms jūs jaunināt.

  2. 2

    Izvēlieties maizes balsi

    Atvērt balss bibliotēka un izvēlēties Bark skaļrunis priekšstādīt, kas atbilst toni vēlaties. Barks balsis ir marķētas kā premium līmenis (25 kredīti uz 1000 rakstzīmēm) un tiek pielāgots emocionālai, rakstzīmju stila narration.

  3. 3

    Ievadiet tekstu ar emocijzīmēm

    Rakstīt savu skriptu un iegult Cieto emociju marķieri ieskaitīts: [meitnieks] par smieties, [sijas] par sijas, [gasps] par gasps,... par pauzi, un CAPS par uzsvaru. Piemēram: "Owow! [meitnieks] Tas ir AMAZING... Es nevaru noticēt!"

  4. 4

    Ģenerēt audio

    Noklikšķiniet Ģenerēt un mīklu padara jūsu tekstu izteiksmīgu runu, pārvēršot katru marķieri par atbilstošu skaņu. Paaudze ir lēnāka nekā vieglie dzinēji, jo Bark transformatora modelis, tāpēc ļaujiet dažas papildu sekundes vienā teikumā.

  5. 5

    Lejupielādēt vai izmantot API

    Priekšskatīt rezultātu, tad lejupielādēt to kā MP3, WAV, vai OGG. Lai automatizētu Bark savā aplikācijā, piezvaniet TextToSpeechAI API ar Bark balsi un to pašu marķiera bagāts teksts, lai saņemtu atpakaļ izteiksmīgs audio.

miza API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tas ir pārsteidzoši, es tikai mīlu, cik izteiksmīgi tas izklausās!",
    "voice": "bark-zh_0"
  }'

Bieži uzdoti jautājumi

Barks ir transformatoru veidots Suno, uz tekstu balstītais modelis. Atšķirībā no tradicionālajām TTS sistēmām, maskas rada ļoti izteiksmīgu runu ar dabīgām emocijām, smiekliem, dusmām un citām neverbālām skaņām. Tas var pat radīt mūziku un skaņas efektus.

Jā, Bark ir atvērts avots saskaņā ar MIT licenci, ļaujot bezmaksas komerciālo izmantošanu. TextToSpeechAI, mēs iekasējam 25 kredītus par 1000 rakstzīmēm, jo ievērojami GPU resursi ir nepieciešami ražošanai.

Barks atbalsta 13+ valodas, tostarp angļu, vācu, spāņu, franču, hindi, Itālijas, Japānas, Korejas, Polijas, Portugāles, Krievijas, Turcijas un ķīniešu. Katra valoda ir dabas izruna un akcenti.

Mīkls ir lēnāks nekā lielākā daļa TTS dzinējiem, jo tā autoregessive transformatoru arhitektūra. Tipisks teikums aizņem 5-15 sekundes, lai radītu GPU. Nelīdzsvarots ir ievērojami izteiksmīgāks un dabas produkciju.

Barks piedāvā tikai ierobežotu balss klonēšanu caur "semantiskajiem pamudinājumiem" un skaļruņu priekšsesijām, tāpēc tas nevar ticami klonēt patvaļīgu balsi no parauga. Ja pilns balss klonēšana ir jūsu mērķis, izmantojiet F5-TTS, StyleTTS2, OpenVoice, vai Tortoise vietā, viss pieejams TextToSpeechAI.

Barka lasa ierindas marķierus ievietoti tieši jūsu tekstā, un pārvērš tos atbilstošās skaņas. Izmantojiet [meitnieks] smieties, [sijas] par sijas, [gasps] par gasps,... par aizdomu vai pauzi, un CAPS par uzsvaru. Piemērs: "Owow! [meitnieks] Tas ir AMAZING... Es nevaru noticēt!"

Bez vienkāršas runas, miza var radīt neverbālas skaņas kā smiekli, sijas, rīkles nosegumi, un dzeltes, kā arī vienkāršu mūziku un ietekmi uz vidi. Tie tiek aktivizēti ar marķieriem, piemēram, [meitnieks], [sasniegumi] un [gasps] iegults tekstā, kas padara mīklu izteiktāku par standarta TTS.

Barks ražo ļoti kvalitatīvu audio ar dabas izteiksmīgumu, kas konkurē cilvēka runu emocionāla satura. 24kHz izvade izklausās profesionāli, lai gan tīra runas kvalitāte ir nedaudz zemāka par Styletts2.

Stieplei nepieciešama 8-12GB VRAM, atkarībā no modeļa lieluma. Pilnais modelis prasa ~12GB, bet mazāki varianti strādā ar 8GB. Procesora ievade ir ļoti lēna un nav ieteicama.

Jā, Bark ir MIT licencēts, kas ļauj neierobežotu komerciālu izmantošanu bez licencēšanas maksas. Jūs varat izmantot Bark produktos, pakalpojumos, un lietojumprogrammās brīvi. Uz TextToSpeechAI jūs varat izmēģināt Bark bezmaksas, izmantojot savu pierakstīšanās kredītus, pirms maksājat par vairāk.

Barks izceļas ar izteiksmīgu vienskanāla runu ar emocionāliem marķieriem, piemēram, [meitnieks] un [atraisnieks], savukārt Dia ir veidota vairāku skaļruņu dialogam ar [S1]/[S2] pagriezieniem un neverbāliem kubiem. Izvēlieties maskas emocionālai narācijai un rakstura balss, un Dia muguras un četrdesmito sarunu. Abi ir pieejami TextToSpeechAI.

Mīkls ir unikāls, jo spēj radīt patiesi izteiksmīgu runu ar emocijām un neverbālām skaņām. Tas ir lēnāks nekā citi dzinēji, bet rada vairāk cilvēka veida rezultātus radošam saturam. Ātrākai sintēzei, izmantojiet Piper. Balss klonēšanai, izmantojiet F5-TTS vai OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try miza Now

Generate your first audio free. No credit card required.

Start Free