Қоплам

Premium

Эмоциялар ва товуш эффектлари билан ифодали AI сўзлашуви

Slow Тезлик
Very Good Сифати
Йўқ Клонлаш
13 Тиллар

Маълумот Қоплам

-text audio. Bark is a

Ключа хусусиятлар

Эмоциялар

(Ушбу оятда Аллоҳ таоло Пайғамбаримиз Муҳаммадга (с. а. в.) хитоб қилиб, мўминлар биродар эканликларини баён қилмоқда.)

Эмоциялар белгилари

(Бу оятда Аллоҳ таоло Пайғамбаримиз Муҳаммадга (с. а. в.) хитоб қилиб, Қуръондан бир оят нозил қилишни амр қилмоқда.)

Кўп тилли

13+ тилларни табиий акцент ва талаффуз билан қўллаб-қувватлайди.

Мусиқа ва таъсирлар

Оддий мусиқа ва атроф-муҳит товушларини яратиш мумкин.

Сўҳбатдошнинг олдинги мосламалари

Кўплаб олдиндан тайёрланган, турли услубдаги сўзловчи овозлари.

Очиқ манба

MIT лицензияси билан тўлиқ бизнес фойдаланиш ҳуқуқи билан.

Ишлатиш ҳолатлари

Характер диалоги Анимацияланган мазмун Аудиокниёзнинг сўзлашуви Ўйин овози Илмий лойиҳалар Экспрессив ёрдамчилар

Қоплам Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Қўллаш усули Қоплам

  1. 1

    Бепул рўйхатдан ўтинг ва демони очинг

    Сизнинг бошланғич кредитларингизни олиш учун бепул TextToSpeechAI ҳисобни яратинг ёки Bark'ни ҳозироқ синаш учун рўйхатдан ўтмасдан демодан фойдаланинг. Бепул кредитлар янгиланишдан олдин бир неча ифодали Bark'лар яратиш учун етарли.

  2. 2

    Барк овозини танлаш

    Товуш китобхонасини очинг ва хоҳлаган тонингизга мос келадиган Bark Speaker Preset'ни танланг. Bark овозлари premium даражаси (1000 та белги учун 25 кредит) сифатида белгиланган ва ҳиссий, характер услубидаги сўзлашув учун созланган.

  3. 3

    Emoticons билан матн киритиш

    Скриптни ёзинг ва Bark эмоционал белгиларини сатр ичига жойланг: [laugh] кулиш учун, [sighs] ҳўнграш учун, [gasps] нафас олиш учун,... тўхтатиш учун ва CAPS диққатга сазовор жойлар учун. Мисол учун: "Оҳ, бу ажойиб! [laugh] Бу ажабланарли... Мен бунга ишонмайман!"

  4. 4

    Аудио яратиш

    "Юклаб олиш ва бақириш" тугмасини босиш матнингизни ифодали сўзлашувга айлантиради, ҳар бир белгини мос товушга айлантиради. Юклаб олиш Bark'нинг трансформатор модели туфайли енгил моторлардан секинроқ, шунинг учун ҳар бир жумлага бир неча секунд қўшиб қўйинг.

  5. 5

    API юклаб олиш ёки фойдаланиш

    Натижанинг олдиндан кўриш, сўнгра уни MP3, WAV ёки OGG шаклида юклаб олиш. Ўз дастурингизда Bark'ни автоматлаштириш учун Bark овози ва ифодали аудиони олиш учун бир хил маркаланган матн билан TextToSpeechAI API'ни чақиринг.

Қоплам API

TextToSpeechAI REST API ёрдамида дастурий сўзлашув яратиш.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Оҳ, ажабланарли! [кулади] Бу ажабланарли... Мен бунинг қанчалик ифодали товуш эканини МЕҲРЛАЯПМАН!",
    "voice": "bark-zh_0"
  }'

Доимий сўраладиган саволлар

Bark Suno томонидан яратилган трансформаторга асосланган матн-аудио моделидир. Тўғри, анъанавий TTS тизимларидан фарқли равишда, Bark табиий ҳис-туйғулар, кулги, титроқ ва бошқа сўзсиз товушлар билан жуда ифодали сўзлашувни яратади. У ҳатто мусиқа ва товуш эффектларини ҳам яратиши мумкин.

Ҳа, Bark MIT лицензияси остида очиқ манба бўлиб, бепул савдо мақсадларида фойдаланишга рухсат беради. TextToSpeechAI'да, биз 1000 ҳарф учун 25 кредит тўлаймиз, бу яратиш учун зарур бўлган GPU ресурслари туфайли.

Bark 13+ тилларни қўллаб-қувватлайди, жумладан инглиз, немис, испан, француз, ҳинд, итальян, япон, корейс, поляк, португал, рус, турк ва хитой тилларини. Ҳар бир тил табиий талаффуз ва акцентга эга.

Bark кўпгина TTS моторларидан унинг авторегрессив трансформатор архитектураси туфайли секинроқдир. Типик жумла GPUда 5-15 секундда яратилади. Бунинг натижасида кўпроқ ифодали ва табиий чиқим ҳосил бўлади.

Bark фақатгина "семантик саволлар" ва сўзловчининг олдиндан белгиланган параметрлари орқали чекланган овозни клонлашни таклиф қилади, шунинг учун у намунадан ихтиёрий овозни ишончли клонлай олмайди. Агар тўлиқ овозни клонлаш мақсадингиз бўлса, унинг ўрнига F5-TTS, StyleTTS2, OpenVoice ёки Tortoise'ни ишлатинг, барчаси TextToSpeechAI'да мавжуд.

Bark матнингизга тўғридан-тўғри жойлаштирилган сатр белгиларини ўқийди ва уларни мос овозларга айлантиради. Кўнгил очиш учун [laughter], ўкинч учун [sighs], ўкинч учун [gasps],... қийналишга ёки тўхтамга, ва таъкидлаш учун CAPS. Мисол: "Оҳ, бу ажабланарли! [laughter] Бу ажабланарли... Мен бунга ишонмайман!"

Барк оддий сўзлашувдан ташқари, кулиш, ҳўнграш, нафас олиш, оғиз бўшлиғини тозалаш ва нутқни бузилиши каби сўзсиз товушларни, шунингдек, оддий мусиқа ва атроф-муҳит таъсирларини ҳам ишлаб чиқара олади. Булар [laughter], [sigh], ва [gasps] каби матнга ёпиштирилган белгилар билан ишга туширилади, бу эса Баркни стандарт TTSдан кўра кўпроқ ифодали қилади.

Bark инсон нутқига рақобат қиладиган руҳий мазмун учун табиий ифодалилик билан жуда яхши сифатли аудиони ишлаб чиқаради. 24 кГц чиқинди профессионал товушни беради, гарчи тоза сўз сифати StyleTTS2 дан бир оз паст бўлса ҳам.

Bark модел ҳажми катталигига қараб 8-12GB VRAM талаб қилади. тўлиқ модел ~12GB талаб қилади, кичик вариантлар эса 8GB билан ишлайди. CPU индукцияси жуда секин ва тавсия этилмайди.

Ҳа, Bark MIT лицензияси остида бўлиб, бу лицензия тўловларисиз чекланмаган савдо мақсадларида фойдаланишга рухсат беради. Сиз Bark'ни маҳсулотлар, хизматлар ва дастурларда эркин фойдаланишингиз мумкин. TextToSpeechAI'да сиз кўпроқ пул тўлашдан олдин Bark'ни бепул синовдан ўтказишингиз мумкин.

Bark [кулиб] ва [ҳеч нарса демай] каби ҳиссиёт белгилари билан бир сўзловчининг сўзлашувида яхши ишлайди, Dia эса [S1]/[S2] айланишлари ва сўзсиз кўрсатмалари билан кўп сўзловчилар диалоги учун яратилган. Bark ҳиссиётли ҳикоя ва персонаж овози учун, Dia эса олдинга-кетишга суҳбат учун танланади. Иккаласи ҳам TextToSpeechAIда мавжуд.

Bark руҳий ва сўзсиз товушлар билан ҳақиқий ифодали сўзлашувни яратиш қобилияти билан ажралиб туради. У бошқа моторлардан секинроқ, аммо креатив мазмун учун инсонга ўхшаш натижаларни яратади. Тез синтез учун Piper'дан фойдаланинг. Товушни клонлаш учун F5-TTS ёки OpenVoice'дан фойдаланинг.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Қоплам Now

Generate your first audio free. No credit card required.

Start Free