Кора

Premium

Экспрессивная АИ речь с эмоциями и звуковыми эффектами

Slow Скорость
Very Good Качество
Нет Клонирование
13 Знание языков

О том, что Кора

Барк — это модель, основанная на трансформаторе, которая может генерировать очень выразительную речь с эмоциями, смехом, вздыханием и другими невербальными звуками. В отличие от традиционных ТТС, Барк понимает контекст и может производить речь, которая действительно является выразительной и человеческой. Она поддерживает множество языков и может даже генерировать музыку и звуковые эффекты.

Основные характеристики

Эмоциональное выражение

Размечтаться, вздыхать, вздохи и по - настоящему эмоциональные чувства.

Эмоциональные маркеры

Используйте [смех], [вздыхает], CAPS для акцента и... для колебаний.

Многоязычные

Поддерживает 13+ языков с естественным акцентом и произношением.

Музыка & эффекты

Может генерировать простую музыку и экологические звуки.

Пресеты

Множество предварительно подготовленных голосов с разными стилями.

Открытый источник

МТИ имеет лицензию на полное коммерческое использование.

Использовать

Диалог с символами Анимированный контент Аудиовизуальная книга Игра Голос Творческие проекты Помощники по экспресс-снабжению

Кора Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Как пользоваться Кора

  1. 1

    Запишитесь бесплатно и откройте демо.

    Создайте бесплатный TextToSpeechAI аккаунт, чтобы получить ваши стартер-кредиты, или используйте безымянный демо, чтобы попробовать Барка прямо сейчас. Бесплатные кредиты достаточно, чтобы создать несколько экспрессивных Барковых клипов перед обновлением.

  2. 2

    Выбери голос коры

    Откройте голосовую библиотеку и выберите скрипку, которая соответствует вашему тону. Барк голоса обозначаются как премиальный уровень (25 баллов на 1000 символов) и настроены на эмоциональную повествование в стиле персонажа.

  3. 3

    Введите текст с эмоциональными маркерами

    Напечатайте сценарий и вставьте в линию маркеры эмоций Барка: [смех] для смеха, [вздыхает] для вздыхания, [вздыхает] для вздохов,... для паузы и CAPS для акцента. Например: "Ого! [смех] Это потрясающе... я не могу в это поверить!"

  4. 4

    Создать звук

    Нажмите Generale и Bark превращает ваш текст в экспрессивную речь, превращая каждый маркер в соответствующий звук. Построение медленнее, чем легкие двигатели из-за модели Bark, так что дайте несколько дополнительных секунд за предложение.

  5. 5

    Загрузка или использование API

    Просмотр результата, затем скачать его как MP3, WAV или ОГГ. Чтобы автоматизировать Барка в вашем собственном приложении, позвоните на TextToSpeechAI API с голосом Барка и таким же маркерным текстом, чтобы получить обратно экспрессивный звук.

Кора API

Создать речь программно используя TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Ого! Это потрясающе... мне просто нравится, как это звучит!",
    "voice": "bark-zh_0"
  }'

Часто задаваемые вопросы

Барк - это модель, созданная Suno на основе трансформатора, в отличие от традиционных систем TTS, Барк производит весьма экспрессивную речь с естественными эмоциями, смехом, вздыханием и другими невербальными звуками.

Да, Барк является открытым источником в рамках лицензии МТИ, что позволяет бесплатно использовать его в коммерческих целях. TextToSpeechAI, мы взимаем 25 кредитов на 1000 знаков из-за значительных ресурсов ГПС, необходимых для производства.

Барк поддерживает 13+ языков, включая английский, немецкий, испанский, французский, хинди, итальянский, японский, корейский, польский, португальский, русский, турецкий и китайский.

Барк медленнее большинства двигателей ТТС из-за его архитектуры авторегресивных трансформаторов. Типичное предложение занимает 5-15 секунд, чтобы генерировать GPU. Компромисс значительно более экспрессивный и натуральный выход.

Барк предлагает лишь ограниченное клонирование голоса через "семантические сигналы" и предваряет громкую связь, поэтому он не может надежно клонировать произвольный голос из выборки. Если полное клонирование голоса является вашей целью, используйте F5-TTS, StyleTTS2, OpenVoice, или Tortoise, вместо этого, все доступно на TextToSpeechAI.

Барк читает маркеры, которые вы записали в вашем тексте, и превращает их в похожие звуки.

Помимо простой речи, Барк может производить невербальные звуки, как смех, вздохи, вздохи, расщепление горла и заикания, плюс простую музыку и экологические эффекты. Они запускаются такими маркерами, как [смех], [вздыхает] и [вздыхает] встроенный в текст, что делает Барка более экспрессивным, чем стандартный TTS.

Барк производит очень хороший качественный аудиоснимок с естественной экспрессивностью, которая противопоставляет человеческую речь эмоциональному содержанию. 24kHz звуки профессионалы, хотя чистое качество речи немного ниже StyleTTS2.

Для изготовления корки требуется 8-12GB VRAM в зависимости от размера модели. Полная модель нуждается в ~12GB, а менее крупные варианты работают с 8GB. Вывод процессора является крайне медленным и не рекомендуется.

Да, Барк лицензирован в МТИ, что позволяет неограниченное коммерческое использование без лицензионных сборов. Вы можете свободно использовать Барк в продуктах, услугах и заявках. TextToSpeechAI вы можете бесплатно использовать Барк, прежде чем платить больше.

Барк преуспевает в экспрессивной одноговорительной речи с эмоциональными маркерами, как [смех] и [вздыхает], в то время как Диа построена для многоязычного диалога с [S1]/[S2] поверхами и невербальными кью. Выбери Барка для эмоциональной повествования и голоса персонажа, и Диа для ретроспективных разговоров. Оба они доступны на TextToSpeechAI.

Барк уникальна в своей способности создавать действительно выразительную речь с эмоциями и невербальными звуками. Она медленнее других двигателей, но приносит больше человеческих результатов для творческого контента. Для ускорения синтеза используйте Piper. Для клонирования голоса используйте F5-TTS или OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Кора Now

Generate your first audio free. No credit card required.

Start Free