Брус

Premium

Висловлювана мова з емоціями та звуковими наслідками

Slow Швидкість
Very Good Якість
Ні Клонування
13 Мови

Про програму Брус

Bark - це модель, заснована на текстовому тексті на звуковому тексті, яка може створювати дуже виразну мову з емоціями, сміхом, зітханням та іншими звуками, що не належать до verbal. На відміну від традиційного TTS, Bark розуміє контекст, вона може створювати мовлення, які видаються дуже виразними і подібними до людини. Вона підтримує декілька мов і може навіть створювати музику і звукові ефекти.

Можливості ключів

Емоційне вираження

Створюйте мову, сміючись, зітхаючи, зітхаючи та пориваючи, і по - справжньому хвилюючись.

Позначки емоцій

Використовувати [сміх], [зітхання], CAPS для акценту, і... для вагання.

Багатомовний

Підтримка 13+ мов з природним акцентом і вимовою.

& Ефекти музики

Може створювати просту музику та звуки довкілля.

Шаблони мовника

Декілька попередньо підготовлених ораторських голосів з різними стилями.

Відкрити джерело

МТІ узаконили права на повну комерційну діяльність.

Випадки використання

Діалогове вікно символів Анімований вміст Передача аудіокнижки Дія за голосом гри Творчі проекти Експресивні помічники

Брус Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Як користуватися Брус

  1. 1

    Розписатися безкоштовно і відкрити демонстрацію

    Створіть безкоштовний обліковий запис TextToSpeechAI, щоб отримати кредити на початку роботи або скористайтеся демонстрацією без підпису, щоб одразу спробувати скористатися панеллю. Ви можете створити декілька додаткових звітів, перш ніж створювати такі стовпчики.

  2. 2

    Виберіть голос блокади

    Відкрийте бібліотеку голосів і оберіть набір мовних файлів, які відповідають вказаному вами тону. Голоси брусків буде позначено як преміальна (25 кредитів на 1000 символів) і їх буде налаштовано для емоційної, у стилі символів.

  3. 3

    Введіть текст з позначками емоцій

    Введіть свій сценарій і вбудуйте в текст позначки емоцій: [сміх] для сміху, [зітхання] для зітхання,... для паузи, і CAPS для підкреслення. Наприклад: "Ого! [сміх] Це!

  4. 4

    Створити звуковий файл

    Натисніть кнопку Створити і Стовпчик, щоб перетворити ваш текст у виразну мову, перетворюючи кожен з позначок на відповідний звук. Створення повільніше за легкі рушії через модель перетворення Bark, отже, запустіть декілька додаткових секунд для речення.

  5. 5

    Звантажити або скористатися API

    Перегляньте результат, а потім звантажте його як MP3, WAV або OGG. Щоб створити автоматично Back у вашій програмі, звантажте TextToSpeechAI API голосом, який відповідає за блок- текст, який зберігається у вигляді маркерів, щоб отримати звук з виразами.

Брус API

Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Це дивовижно... як це звучить!",
    "voice": "bark-zh_0"
  }'

Часті запитання

Bark - це заснована на текстовій системі модель перетворення тексту на звукову форму, створена Suno. На відміну від традиційних систем TTS, Bark створює дуже виразну мову з природними емоційами, сміхом, зітханнями та іншими невербальними звуками. Вона може навіть створювати музичні та звукові ефекти.

Так, Bark є відкритим джерелом за ліцензією MIT, що надає вам змогу вільно використовувати комерційні послуги. TextToSpeechAI ми беремо 25 кредитів на 1000 символів через значні ресурси GPU, необхідні для створення.

У барка передбачено 13 мов, зокрема англійська, німецька, іспанська, французька, гінді, італійська, японська, корейська, польська, португальська, російська, турецька, китайська. Кожна з мов має природні вимови і акценти.

Back повільніший за більшість рушіїв TTS через його авторегресивну архітектуру перетворення. Типове речення потребує 5- 15 секунд для створення на GPU. Обмін даними значно більш виразний і природний вивід.

У Back передбачено лише обмежену кількість голосових клонувань за допомогою " semantic Settings " і набору налаштувань для промовця, отже, неможливо повторно клонувати довільний голос з зразка. Якщо вашим завданням є повне клонування голосів, скористайтеся F5- TTS, StyleTTS2, OpenGous або Tortose, всі доступні на TextToSpeechAI.

Барк читає вбудований маркер, який розміщено безпосередньо у вашому тексті і перетворює його на звуки, що відповідають одне одному. Скористайтеся [сміхом] для зітхання, [зітхання] для зітхання,... для зволікання або паузи, а KES для акценту. Приклад: "Ого! [сміх] Це ам' яс... я не можу повірити цьому! "

Крім простої мови, Барк може створювати такі невербальні звуки, як сміх, зітхання, розмивання горла, заїкання, плюс проста музика та ефекти оточення. Такі звуки викликаються маркерами, такими як [сміх], [зітхання] і [зітхання] вбудовані в текст, що робить Барка більш виразним, ніж стандартні ТТЗ.

Back створює дуже якісний звуковий файл з природною експресивністю, яка може порівнювати людську мову з емоційним вмістом. Звуки, які виводить 24kГц, незважаючи на те, що якість мовлення трохи нижча за якість StyleTTS2.

Для роботи Back потрібно 8- 12GB VRAM, залежно від розміру моделі. Повна модель потребує ~12GB, менші варіанти працюють з 8GB. Підсумки процесора дуже повільні, і не рекомендується.

Так, Bark має ліцензію на MIT, яка дозволяє безперешкодно використовувати комерційні послуги без ліцензійних плат. Ви можете використовувати барку у продуктах, службах і програмах безкоштовно. TextToSpeechAI можна без перешкод скористатися кредитами за підписку, перш ніж платити за додаткові.

Back winder під час показу виразленої промови з позначками емоцій на зразок [сміх] і [зітхання], а Dia побудовано для багатомовного спілкування з [S1] / [S2] і невербальними знаками. Оберіть пункт барка для емоційної орієнтації і голосу символів, а Dia для розмов з зворотним імом. Обидва варіанти доступні на TextToSpeechAI.

Панель брусів унікальна у своїй здатності створювати рефлексивну мовлення з емоціями і невербальними звуками. Вона повільна за інші рушії, але дає більше людських результатів для творчих даних. Для пришвидшення синтезу скористайтеся Piper. Для клонування голос можна скористатися F5- TTS або OpenTR.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Брус Now

Generate your first audio free. No credit card required.

Start Free