Отворен глас

Ultra

Мигновено клониране на гласа с гранулярен тон контрол

Moderate Скорост
Very Good Качество
Да. Клониране
10 Езици

За Отворен глас

OpenVoice е универсален мигновено клониране на гласа модел, който позволява фино земен контрол над говорещия стил. За разлика от други модели на клониране, OpenVoice отделя гласовата идентичност от говорещия стил, което ви позволява да вземете клониран глас и да прилагате различни тонове - весели, тъжни, ядосани, развълнувани или шептащи - без нов референтен звук.

Ключови характеристики

Мигновено клониране

Клонирайте всеки глас от само няколко секунди звук.

Контрол на тона

Прилагайте весели, тъжни, ядосани, развълнувани или шепотещи тонове.

Прехвърляне на стил

Отделете гласовата идентичност от говорещия стил за гъвкавост.

Кръстословно

Използвайте клонирани гласове на различни езици.

Бърза обработка

Ефективен извод за бързо поколение на глас.

Отворен източник

MIT лицензирани за търговски заявления.

Случаи за използване

Емоционално съдържание Анимация на символи Интерактивни игри Аудиокнига Нарация Маркетингови видеозаписи Виртуални асистентки

Как да използвате Отворен глас

  1. 1

    Запишете се безплатно или опитайте демото

    Създаване на безплатен акаунт TextToSpeechAI, за да получите стартер кредити, или да използвате демото на страницата, за да чуете OpenVoice преди да се извърши. Не е необходимо местен GPU или инсталиране - всичко работи на нашите сървъри.

  2. 2

    Изберете отворен глас и качване на референтен клип

    Изберете двигателя OpenVoice, след което качване на няколко секунди чист референтен звук за мигновено клониране на целевия глас. OpenVoice заснема идентичността на говоритела, така че можете да го повторно използвате през всеки текст и тон.

  3. 3

    Въведете вашия текст

    Напишете или вставете скрипта, който искате да се говори в клонирания глас. OpenVoice поддържа около 10 езика и кръстословна доставка, така че можете да пишете на друг език от референтния клип.

  4. 4

    Изберете тон стил и генерирате

    Изберете един от деветте стила на отворен глас - по подразбиране, приятелски, весели, развълнувани, тъжни, ядосани, ужасени, крещене или шептане - след това генерира. Същият клониран глас ще говори с тази емоционална доставка.

  5. 5

    Изтеглете или използвайте API

    Изтеглете звука си като MP3, WAV, или OGG, или автоматично поколение през TextToSpeechAI API чрез предаване на вашия клониран глас и тон стил в всяко искане.

Отворен глас API

Генерирайте речна програма с помощта на TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Отворен глас може да говори с всеки тон \u002D весел, тъжен или дори шепне.",
    "voice": "en_US-lessac-medium"
  }'

Често задавани въпроси

OpenVoice е напреднал модел за клониране на текста и гласа, който уникално отделя гласовата идентичност от говорещия стил. Това ви позволява да клонирате глас и след това прилагате различни емоционални тонове, без да се нуждаете от нов референтен звук за всяка емоция. Той е изграден за експресивно, контролирано генериране на реч.

Да, OpenVoice изпълнява мигновено клониране на гласа от само няколко секунди референтен звук - не се изисква тренировка. След като гласът е заснет, OpenVoice може да използва тази идентичност през всеки текст и всеки тон стил, който изберете.

OpenVoice използва двуетапна архитектура, която разделя синтеза на основната реч от преобразуване на тона. След клониране на глас, можете да приложите всеки от 9 тона стилове - по подразбиране, приятелски, весели, вълнувани, тъжни, ядосани, ужасени, крещящи или шептащи - и същият клониран глас говори различно въз основа на избрания си тон без презаписване.

OpenVoice поддържа девет говорещи стилове: по подразбиране, приятелски, весели, развълнувани, тъжни, ядосани, ужасени, крещене и шептане. Всеки стил преобразува емоционалната доставка, докато запазва клонираната идентичност на оратора, дава фино-зървен контрол над това как се чете една линия.

OpenVoice е отворен източник по лиценза на MIT, така че е свободен за търговска употреба. Както при всеки модел на клониране, уверете се, че имате подходящи права на всеки глас, който клонирате за търговски проекти.

Отворен глас поддържа около 10 езика, включително английски, китайски, японски, корейски и няколко европейски езика. Той предлага също кръстословично клониране, така че можете да клонирате глас на един език и да го говорите естествено на друг.

Отворен глас има умерена генерационна скорост, обикновено изречение в 2-4 секунди на GPU. Качеството на изхода е много добро, с ясна гласова репродукция и трансфер на тон, който поддържа идентичността на оратора непокътнати, като убедително променя емоционалната доставка.

Отворен глас обикновено изисква 6-8GB VRAM в зависимост от размера на партидата и преобразуването на тона. Той работи удобно на средната до горната средна граница GPUs, а на TextToSpeechAI всичко това се обработва на нашите сървъри, така че не се нуждаете от местно хардуерно.

OpenVoice е ултра-тиер двигател, ценен с 50 кредита на 1000 символа. Ултра нивото отразява своя напреднал тон контрол и допълнително изчисление, необходимо за клониране плюс стил-конверсия трубопровод.

Отворен глас е уникален за своя тон и стил контрол: можете да вземете един клониран глас и да го отново доставят като весел, тъжен, ядосан или шепнещ. F5-TTS е по-бърз и е нашият стандартен клонинг двигател за естествена, неутрална реч. Изберете OpenVoice, когато се нуждаете от емоционален стил контрол, и F5-TTS, когато искате най-бързия естествен клонинг.

Създаване на клониран глас чрез качване на референтен звук, след което се посочва стил на тон във вашия API искане. API прилага избрания си емоционален тон към клонирания глас автоматично и връща звука в формат MP3, WAV или OGG.

Да. Регистрирайте се за безплатен TextToSpeechAI акаунт, за да получите стартер кредити и да опитате OpenVoice клониране и тон контрол, или да използвате демото на страницата първо. Няма локален настройка - качване на референтен клип, изберете тон, и генерирайте в браузъра.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try Отворен глас Now

Generate your first audio free. No credit card required.

Start Free