OpenVoice

Ultra

Инстанционное клонирование голоса с контролем гранулярного тона

Moderate Скорость
Very Good Качество
Выполнено Клонирование
10 Знание языков

О том, что OpenVoice

OpenVoice — разносторонняя модель клонирования голоса, которая позволяет тонким гранулированным контроль над стилем речи. В отличие от других моделей клонирования OpenVoice отделяет голосовую идентичность от стиля речи, позволяя вам принимать клонированный голос и применять разные тоны - веселые, печальные, злые, возбужденные или шепот - без нового справочного звука.

Основные характеристики

Мгновенное клонирование

Скопируй любой голос с нескольких секунд звука.

Контроль тона

Примените радостные, печальные, злые, возбужденные или шепотные тоны.

Стиль передачи

Отличить голос от стиля речи для гибкости.

Межлингвальный

Используйте клонированные голоса на разных языках.

Быстрое оформление

Эффективный вывод для быстрого создания голосового голоса.

Открытый источник

МТИ лицензировала коммерческие заявки.

Использовать

Эмоциональный контент Анимация символа Интерактивные игры Аудиовизуальная книга Видеоматериалы маркетинга Виртуальные помощники

Как пользоваться OpenVoice

  1. 1

    Подпишитесь бесплатно или попробуйте демо

    Создать бесплатный TextToSpeechAI аккаунт для получения стартер-кредитов, или использовать встроенную демо-демо, чтобы услышать OpenVoice перед началом. Не нужно местных ГИП или установки - все работает на наших серверах.

  2. 2

    Выберите OpenVoice и загрузите клип

    Выберите двигатель OpenVoice, затем загрузите несколько секунд чистого исходного звука для мгновенного клонирования голоса цели. OpenVoice зафиксирует личность оратора, чтобы вы могли использовать его по всему тексту и тону.

  3. 3

    Введите ваш текст

    Напечатайте или вставьте сценарий, на котором вы хотите говорить в клонированном голосе. OpenVoice поддерживает около 10 языков и транс-языковую передачу, так что вы можете писать на другом языке, чем клип.

  4. 4

    Выберите тон и сформулировать

    Выбери один из девяти стилей OpenVoice - по умолчанию, дружелюбный, веселый, радостный, грустный, злой, напуганный, кричащий или шепот - затем создай.

  5. 5

    Загрузка или использование API

    Загрузите звук в виде MP3, WAV, или ОВГ, или автоматизировать поколение через TextToSpeechAI API, передавая ваш клонированный голос и тон в каждом запросе.

OpenVoice API

Создать речь программно используя TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Опендвойс может говорить в любом тоне: веселый, грустный или даже шепот.",
    "voice": "en_US-lessac-medium"
  }'

Часто задаваемые вопросы

OpenVoice — усовершенствованная модель клонирования голосов и голосов, которая отделяет голосовую идентичность от стиля речи. Это позволяет клонировать голос и применять различные эмоциональные тоны без необходимости нового справочного аудио для каждой эмоций. Она построена для экспрессивного, контролируемого поколения речи.

Да, OpenVoice осуществляет мгновенное клонирование голоса с нескольких секунд эталонного аудио — не требуется тренировочного прогона. После того как голос запечатлен, OpenVoice может повторно использовать эту личность в любом тексте и любом тоневом стиле, который вы выбираете.

OpenVoice использует двухэтапную архитектуру, которая разделяет синтез базовой речи от преобразования тона. После клонирования голоса вы можете применить любой из 9-ти стилей тона - по умолчанию, дружелюбный, веселый, волненный, грустный, злой, напуганный, кричащий или шепящий - и тот же клонированный голос говорит по-разному, основываясь на выбранном тоне без перезаписи.

OpenVoice поддерживает девять стилей речи: по умолчанию, дружелюбный, веселый, радостный, грустный, злой, напуганный, кричащий и шепот. Каждый стиль меняет эмоциональную доставку, сохраняя при этом клонированную личность, обеспечивая тонкий контроль над тем, как читается линия.

OpenVoice - открытый источник в рамках лицензии МТИ, поэтому она свободна для коммерческого использования. Как и любая модель клонирования, убедитесь, что у вас есть права на любой голос, который вы клонируете для коммерческих проектов.

OpenVoice поддерживает около 10 языков, включая английский, китайский, японский, корейский и несколько европейских языков. Она также предлагает клонирование на разных языках, чтобы вы могли клонировать голос на одном языке и говорить естественно на другом.

OpenVoice имеет умеренную скорость поколения, обычно производя предложение за 2-4 секунды на GPU. Качество вывода очень хорошее, с чётким воспроизведением голоса и переносом тона, который сохраняет личность оратора в сохранности, и при этом убедительно меняет эмоциональное состояние.

OpenVoice обычно требует 6-8GB VRAM в зависимости от размера партии и нагрузки на тон. Она работает на среднем диапазоне в верхние средние GPU, и на TextToSpeechAI все это обрабатывается на наших серверах, так что вам не нужно никакого местного оборудования.

OpenVoice — ультрауровневый двигатель, стоящий по 50 градусов на 1000 знаков. Ultra system отражает свой продвинутый тон и дополнительные расчеты, необходимые для клонирования и трубопровода стиля-конверсии.

OpenVoice уникальна для своего тона и стиля управления: вы можете взять один клонированный голос и перепродать его как веселый, грустный, злой или шепот. F5-TTS быстрее и является нашим двигателем клонирования для естественной, нейтральной речи. Выберите OpenVoice, когда вам нужен контроль эмоционального стиля, и F5-TTS, когда вы хотите самый быстрый натуральный клон.

Создать клонированный голос, загружая справочный звук, затем указать тон в запросе API. API применяет выбранный эмоциональный тон к клонированному голосу автоматически и возвращает звук в формате MP3, WAV, или ОВG.

Да. Запишитесь на бесплатный TextToSpeechAI счёт, чтобы получить стартер-кредиты и попробовать клонирование и контроль тона OpenVoice, или сначала использовать демо-выпуск. Здесь нет местной установки - загрузить клип, выбрать тон и создать в браузере.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free