Корпус

Premium

Эмоциялар жана үн эффекттери менен эмоциялар менен AI сүйлөөсү

Slow Жылдамдык
Very Good _Качество
Жок Клондоо
13 Тилдер

Маалымат Корпус

-text audio. Bark is a text-to-audio model that can generate highly expressive speech with non-verbal sounds. It can generate speech that sounds genuinely human-like. Unlike traditional TTS, Bark understands context and can generate multi-language audio with non-verbal sounds. It can generate speech that sounds genuinely human-like. Bark can generate speech that sounds genuinely human with

Ачкыч өзгөчөлүктөрү

Эмоция билдирүү

Күлкү, ый, дем алуу жана чыныгы сезимдер менен сүйлөмдү жаратуу.

Эмоциялар

[күлүп], [күлүп], CAPS баскычын басым үчүн, жана... баскычын күмөн саноолор үчүн колдонуңуз.

Көп тилдүү

13+ тилдердин табигый акценттери жана үнүн колдойт.

Музыка жана эффекттер

Жакшы музыкалык жана айлана-чөйрө үндөрү жарата алат.

Ойнотуучунун алдын-ала орнотуулары

Бир нече алдын-ала даярдалган сүйлөгөндөрдүн үндөрү ар кандай стилдер менен.

Ачык булак

MIT лицензиясы менен толук коммерциялык колдонуу укугу менен.

Колдонуу мисалдары

Символ диалогу Анимацияланган мазмун Аудиокитепти баяндоо Ойноонун үн акыны Долбоорлор Экспрессивдик жардамчылар

Корпус Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Колдонуу Корпус

  1. 1

    Бесплатно зарегистрироваться и открыть демо

    Бесплатный TextToSpeechAI аккаунт создайте для получения стартовых кредитов, или используйте без регистрации демо для того, чтобы попробовать Bark прямо сейчас. Бесплатные кредиты достаточны для создания нескольких выражения Bark клипов до обновления.

  2. 2

    Барк үндү тандоо

    Сөздүктү ачып, каалаган үн менен шайкеш келген сүйлөмдү тандаңыз. Сөздүктөгү сөздөр премиум деңгээлинде (1000 символго 25 кредит) жана эмоциялуу, каарман стилиндеги баяндоого ылайыкташтырылган.

  3. 3

    Эмоциялар менен текстти киргизүү

    Скриптти жазып, анын ичинде эмоция белгилерин киргизиңиз: [laughter] - күлкү үчүн, [sighs] - дем алуу үчүн, [gasps] - дем алуу үчүн,... - pauzes үчүн, жана CAPS - басым үчүн. Мисалы: "О, ооба! [laughter] This is AMAZING... I can't believe it!"

  4. 4

    Аудио түзүү

    Генерировать и говорить текст превращается в интонацию, каждая метка превращается в соответствующий звук. Генерация быстрее, чем легкие двигатели, потому что Bark использует трансформаторную модель, поэтому добавьте несколько секунд к каждому предложению.

  5. 5

    API жүктөп алуу же колдонуу

    Результат предварительного просмотра, затем загрузить его как MP3, WAV или OGG. Для автоматизации Bark в собственном приложении вызовите TextToSpeechAI API с Bark голосом и тем же маркером богатого текста для получения выражения аудио.

Корпус API

TextToSpeechAI REST API'ни колдонуп программалык түрдө сүйлөмдү түзүү.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "О, у\u002Dу! [күлкү] Бул укмуш... Мен бул үндүн канчалык эмоционалдуу экенин жактырдым!",
    "voice": "bark-zh_0"
  }'

Кайра-кайра берилүүчү суроолор

Bark - Suno тарабынан иштелип чыккан тексттен аудиого трансформациялоо модели. Барк адаттагы тексттен аудиого системалардан айырмаланып, табигый эмоцияларды, күлкүнү, ыйлоону жана башка сөзсүз үндү камтыган, өтө эмоционалдуу сүйлөмдү жаратат. Ал музыка жана үн эффекттерин да жаратат.

Ооба, Bark MIT лицензиясы менен ачык булак, эркин коммерциялык колдонууга мүмкүндүк берет. TextToSpeechAIде биз 1000 символ үчүн 25 кредитти төлөйбүз, анткени генерациялоо үчүн GPU ресурстары керек.

Барк 13+ тилдердин колдоосуна ээ, анын ичинде англис, немис, испан, француз, хинди, италия, япон, корей, поляк, португал, орус, түрк жана кытай. Ар бир тил табигый үн чыгаруу жана акценти бар.

Bark көпчүлүк TTS двигательдеринен ылдамыраак, себеби анын авторегрессивдүү трансформатор архитектурасы бар. Жалпысынан, GPUда бир сүйлөмдү жаратуу 5-15 секундду алат. Бирок, бул натыйжада сөздөрдүн көбүрөөк эмоционалдуулугу жана табигыйлыгы пайда болот.

Bark "семантикалык суроолор" жана үн чыгаруучунун алдын-ала орнотуулары аркылуу гана чектелген үн клондоону сунуштайт, ошондуктан ал үлгүдөн каалаган үндү ишенимдүү түрдө клондоого мүмкүн эмес. Эгерде сиздин максатыңыз толук үн клондоо болсо, анда F5-TTS, StyleTTS2, OpenVoice же Tortoise колдонуп көрүңүз, алар TextToSpeechAIде бар.

Барк текстке түздөн-түз коюлган тексттик белгилерди окуп, аларды окшош үнгө айландырат. [laughter] - күлкү үчүн, [sighs] - ыйлоо үчүн, [gasps] - ыйлоо үчүн,... - күмөн саноолор же токтоо үчүн, жана CAPS - басым үчүн колдонулат. Мисалы: "О, ооба! [laughter] Бул КЕҢЕШТИК... Мен ишене албайм!"

Барк сөзсүз сүйлөмдөн тышкары күлкү, ый, дем алуу, оозду тазалоо, ооздон чыккан үндүн үнү, ошондой эле жөнөкөй музыка жана айлана-чөйрө эффекттерин жаратат. Алар текстке киргизилген [laughter], [sighs], and [gasps] сыяктуу белгилер менен ишке ашат, бул Баркты стандарттуу ТТСке караганда көбүрөөк эмоционалдуу кылат.

Барк мыкты сапаттагы үнү менен табигый интонацияны жаратат, бул адамдын үнүнөн да жакшы. 24 кГц чыгаруу профессионалдык үн чыгарат, бирок таза үнүнүн сапаты StyleTTS2ден бир аз төмөн.

Bark моделин өлчөмүнөн көз каранды 8-12 ГБ видеоэскерүү керек. Толук моделге ~12 ГБ керек, ал эми кичине варианттар 8 ГБ менен иштешет. CPU-инференция өтө ылдамыраак жана сунушталбайт.

Да, Bark MIT лицензиясына ээ, бул аны чектелбеген коммерциялык колдонууга уруксат берет. Баркты продуктуларда, кызматтарда жана тиркемелерде эркин колдонсо болот. TextToSpeechAIде сиз Баркты акысыз сынап көрүңүз, андан кийин көбүрөөк акча төлөп, каттоо кредиттерин колдоно аласыз.

Барк [күлүп] жана [күңкүлдөп] сыяктуу эмоция белгилери менен бир сүйлөгөн адамдын сүйлөмүн түшүнүүгө жардам берет, ал эми Диа [S1]/[S2] айлануулары жана сөзсүз түрдө эмес сигналдары менен көп сүйлөгөн адамдын диалогу үчүн иштелип чыккан. Барк эмоциялуу баяндоо жана персонаждын үнү үчүн, Диа - кайра-кайра сүйлөшүү үчүн. Экиси да TextToSpeechAIде бар.

Барк эмоцияларды жана сөзсүз үндөрү бар чыныгы эмоционалдык сүйлөмдү жаратууга мүмкүндүк берет. Бул башка моторлордон ылдамыраак, бирок чыгармачыл мазмундун натыйжалары адамга окшош. Жылдам синтез үчүн Piper колдонуп, үн клондоо үчүн F5-TTS же OpenVoice колдонуп, үн клондоо.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Корпус Now

Generate your first audio free. No credit card required.

Start Free