Корпус

Premium

Эмоциялар жана үн эффекттери менен эмоциялар менен AI сүйлөөсү

Slow Жылдамдык

Very Good _Качество

Жок Клондоо

13 Тилдер

Маалымат Корпус

-text audio. Bark is a text-to-audio model that can generate highly expressive speech with non-verbal sounds. It can generate speech that sounds genuinely human-like. Unlike traditional TTS, Bark understands context and can generate multi-language audio with non-verbal sounds. It can generate speech that sounds genuinely human-like. Bark can generate speech that sounds genuinely human with

Ачкыч өзгөчөлүктөрү

Эмоция билдирүү

Күлкү, ый, дем алуу жана чыныгы сезимдер менен сүйлөмдү жаратуу.

Эмоциялар

[күлүп], [күлүп], CAPS баскычын басым үчүн, жана... баскычын күмөн саноолор үчүн колдонуңуз.

Көп тилдүү

13+ тилдердин табигый акценттери жана үнүн колдойт.

Музыка жана эффекттер

Жакшы музыкалык жана айлана-чөйрө үндөрү жарата алат.

Ойнотуучунун алдын-ала орнотуулары

Бир нече алдын-ала даярдалган сүйлөгөндөрдүн үндөрү ар кандай стилдер менен.

Ачык булак

MIT лицензиясы менен толук коммерциялык колдонуу укугу менен.

Колдонуу мисалдары

Символ диалогу Анимацияланган мазмун Аудиокитепти баяндоо Ойноонун үн акыны Долбоорлор Экспрессивдик жардамчылар

Корпус Voices

View All 130

Bark Chinese Speaker 0

Bark Chinese Speaker 1

Bark Chinese Speaker 2

Bark Chinese Speaker 3

Bark Chinese Speaker 4

Bark Chinese Speaker 5

Bark Chinese Speaker 6

Bark Chinese Speaker 7

Bark Chinese Speaker 8

Bark Chinese Speaker 9

Bark English Speaker 0

Bark English Speaker 1

Колдонуу Корпус

1

Бесплатно зарегистрироваться и открыть демо

Бесплатный TextToSpeechAI аккаунт создайте для получения стартовых кредитов, или используйте без регистрации демо для того, чтобы попробовать Bark прямо сейчас. Бесплатные кредиты достаточны для создания нескольких выражения Bark клипов до обновления.
2

Барк үндү тандоо

Сөздүктү ачып, каалаган үн менен шайкеш келген сүйлөмдү тандаңыз. Сөздүктөгү сөздөр премиум деңгээлинде (1000 символго 25 кредит) жана эмоциялуу, каарман стилиндеги баяндоого ылайыкташтырылган.
3

Эмоциялар менен текстти киргизүү

Скриптти жазып, анын ичинде эмоция белгилерин киргизиңиз: [laughter] - күлкү үчүн, [sighs] - дем алуу үчүн, [gasps] - дем алуу үчүн,... - pauzes үчүн, жана CAPS - басым үчүн. Мисалы: "О, ооба! [laughter] This is AMAZING... I can't believe it!"
4

Аудио түзүү

Генерировать и говорить текст превращается в интонацию, каждая метка превращается в соответствующий звук. Генерация быстрее, чем легкие двигатели, потому что Bark использует трансформаторную модель, поэтому добавьте несколько секунд к каждому предложению.
5

API жүктөп алуу же колдонуу

Результат предварительного просмотра, затем загрузить его как MP3, WAV или OGG. Для автоматизации Bark в собственном приложении вызовите TextToSpeechAI API с Bark голосом и тем же маркером богатого текста для получения выражения аудио.

Корпус API

TextToSpeechAI REST API'ни колдонуп программалык түрдө сүйлөмдү түзүү.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "О, у\u002Dу! [күлкү] Бул укмуш... Мен бул үндүн канчалык эмоционалдуу экенин жактырдым!",
    "voice": "bark-zh_0"
  }'

API документациясын окуу API ачкычыңызды алуу

Кайра-кайра берилүүчү суроолор

Bark - Suno тарабынан иштелип чыккан тексттен аудиого трансформациялоо модели. Барк адаттагы тексттен аудиого системалардан айырмаланып, табигый эмоцияларды, күлкүнү, ыйлоону жана башка сөзсүз үндү камтыган, өтө эмоционалдуу сүйлөмдү жаратат. Ал музыка жана үн эффекттерин да жаратат.

Ооба, Bark MIT лицензиясы менен ачык булак, эркин коммерциялык колдонууга мүмкүндүк берет. TextToSpeechAIде биз 1000 символ үчүн 25 кредитти төлөйбүз, анткени генерациялоо үчүн GPU ресурстары керек.

Барк 13+ тилдердин колдоосуна ээ, анын ичинде англис, немис, испан, француз, хинди, италия, япон, корей, поляк, португал, орус, түрк жана кытай. Ар бир тил табигый үн чыгаруу жана акценти бар.

Bark көпчүлүк TTS двигательдеринен ылдамыраак, себеби анын авторегрессивдүү трансформатор архитектурасы бар. Жалпысынан, GPUда бир сүйлөмдү жаратуу 5-15 секундду алат. Бирок, бул натыйжада сөздөрдүн көбүрөөк эмоционалдуулугу жана табигыйлыгы пайда болот.

Bark "семантикалык суроолор" жана үн чыгаруучунун алдын-ала орнотуулары аркылуу гана чектелген үн клондоону сунуштайт, ошондуктан ал үлгүдөн каалаган үндү ишенимдүү түрдө клондоого мүмкүн эмес. Эгерде сиздин максатыңыз толук үн клондоо болсо, анда F5-TTS, StyleTTS2, OpenVoice же Tortoise колдонуп көрүңүз, алар TextToSpeechAIде бар.

Барк текстке түздөн-түз коюлган тексттик белгилерди окуп, аларды окшош үнгө айландырат. [laughter] - күлкү үчүн, [sighs] - ыйлоо үчүн, [gasps] - ыйлоо үчүн,... - күмөн саноолор же токтоо үчүн, жана CAPS - басым үчүн колдонулат. Мисалы: "О, ооба! [laughter] Бул КЕҢЕШТИК... Мен ишене албайм!"

Барк сөзсүз сүйлөмдөн тышкары күлкү, ый, дем алуу, оозду тазалоо, ооздон чыккан үндүн үнү, ошондой эле жөнөкөй музыка жана айлана-чөйрө эффекттерин жаратат. Алар текстке киргизилген [laughter], [sighs], and [gasps] сыяктуу белгилер менен ишке ашат, бул Баркты стандарттуу ТТСке караганда көбүрөөк эмоционалдуу кылат.

Барк мыкты сапаттагы үнү менен табигый интонацияны жаратат, бул адамдын үнүнөн да жакшы. 24 кГц чыгаруу профессионалдык үн чыгарат, бирок таза үнүнүн сапаты StyleTTS2ден бир аз төмөн.

Bark моделин өлчөмүнөн көз каранды 8-12 ГБ видеоэскерүү керек. Толук моделге ~12 ГБ керек, ал эми кичине варианттар 8 ГБ менен иштешет. CPU-инференция өтө ылдамыраак жана сунушталбайт.

Да, Bark MIT лицензиясына ээ, бул аны чектелбеген коммерциялык колдонууга уруксат берет. Баркты продуктуларда, кызматтарда жана тиркемелерде эркин колдонсо болот. TextToSpeechAIде сиз Баркты акысыз сынап көрүңүз, андан кийин көбүрөөк акча төлөп, каттоо кредиттерин колдоно аласыз.

Барк [күлүп] жана [күңкүлдөп] сыяктуу эмоция белгилери менен бир сүйлөгөн адамдын сүйлөмүн түшүнүүгө жардам берет, ал эми Диа [S1]/[S2] айлануулары жана сөзсүз түрдө эмес сигналдары менен көп сүйлөгөн адамдын диалогу үчүн иштелип чыккан. Барк эмоциялуу баяндоо жана персонаждын үнү үчүн, Диа - кайра-кайра сүйлөшүү үчүн. Экиси да TextToSpeechAIде бар.

Барк эмоцияларды жана сөзсүз үндөрү бар чыныгы эмоционалдык сүйлөмдү жаратууга мүмкүндүк берет. Бул башка моторлордон ылдамыраак, бирок чыгармачыл мазмундун натыйжалары адамга окшош. Жылдам синтез үчүн Piper колдонуп, үн клондоо үчүн F5-TTS же OpenVoice колдонуп, үн клондоо.

Technical Specs

Generation Speed Slow
Output Quality Very Good
Voice Cloning Not Supported
Languages 13
GPU VRAM 8-12GB
Credits/1000 chars 25

Try Корпус Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

Корпус

Маалымат Корпус

Ачкыч өзгөчөлүктөрү

Эмоция билдирүү

Эмоциялар

Көп тилдүү

Музыка жана эффекттер

Ойнотуучунун алдын-ала орнотуулары

Ачык булак

Колдонуу мисалдары

Корпус Voices

Bark Chinese Speaker 0

Bark Chinese Speaker 1

Bark Chinese Speaker 2

Bark Chinese Speaker 3

Bark Chinese Speaker 4

Bark Chinese Speaker 5

Bark Chinese Speaker 6

Bark Chinese Speaker 7

Bark Chinese Speaker 8

Bark Chinese Speaker 9

Bark English Speaker 0

Bark English Speaker 1

Колдонуу Корпус

Бесплатно зарегистрироваться и открыть демо

Барк үндү тандоо

Эмоциялар менен текстти киргизүү

Аудио түзүү

API жүктөп алуу же колдонуу

Корпус API

Кайра-кайра берилүүчү суроолор

Барк ТТС деген эмне?

Барк акысызбы?

Барк кандай тилдер менен иштей алат?

Барк канчалык тез?

Барк үндү клондоого мүмкүнбү?

Барк эмоциясынын маркерлери кандай иштейт?

Барк кандай үндү чыгарат?

Барктын аудио сапаты кандай?

Барктын GPU эси канчага муктаж?

Барк коммерциялык жактан акысызбы?

Bark же Dia: кайсынысын колдонуу керек?

Барк башка ТТС двигательдерине салыштырмалуу кандай?

Technical Specs

Try Корпус Now

Other TTS Engines

Чатбокс

Жакшы үн2

Күн