КоссиВойце2

Premium

Клонирование с нулевым числом голосовых сигналов при поддержке потокового потока

Fast Скорость
Very Good Качество
Выполнено Клонирование
5 Знание языков

О том, что КоссиВойце2

CosyVoice2 — модель синтеза речи следующего поколения из FunAudioLM (Alibaba), которая обеспечивает естественное клонирование с нулевым звучанием голоса на нескольких языках с речевой способностью для прикладных программ с низкой степенью вероятности.

Основные характеристики

Клонирование нулевого голоса

Скажи любой голос с 3-10 секунд эталонного звука с высокой степенью верности.

Многоязычные

Поддерживает английский, китайский, японский, корейский и кантонский языки с синтезом.

Поддержка рядов

Режим низкоширотного направления для приложений в режиме реального времени и интерактивных систем.

Естественный прозодий

Усовершенствованные прозодиозные модели создают естественную трезвую речь с подходящим интонацией.

Использовать

Создание многоязыкового контента Помощники по голосовой связи в режиме реального времени Перекрестный стул Индивидуальные голосовые приложения

Как пользоваться КоссиВойце2

  1. 1

    Зарегистрируйтесь и подавайте бесплатную кредитку

    Создать бесплатный TextToSpeechAI аккаунт, чтобы получить стартер-кредиты, или попробовать демо сначала. Не нужно установки GPU или местного KosyVoice2 - все работает на нашей инфраструктуре.

  2. 2

    Выберите КозиВойце2 и добавьте клип

    Выберите KosyVoice2 в качестве двигателя, затем загрузите чистую 3-10 секунду контрольного сигнала голоса, который вы хотите клонировать.

  3. 3

    Введите текст на любом поддерживаемом языке

    Напечатайте или вставьте ваш сценарий на китайском, английском, японском, корейском или кантонском языках.

  4. 4

    Выстроить речь

    Нажмите на кнопку "CosyVoice2" и синтезирует естественную многоязычную речь в клонированном голосе, обычно в течение секунд для короткого текста. Использование премиум-уровня стоит 25 титров на 1000 знаков.

  5. 5

    Загрузка или использование API

    Загрузить финальный звук в виде MP3 или WAV из вашей истории, или автоматизировать клонирование голоса KosyVoice2 в масштабе через TextToSpeechAI REST API.

КоссиВойце2 API

Создать речь программно используя TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "KosyVoice2 произносит естественную многоязычную речь с нулевым коэффициентом клонирования голоса.",
    "voice": "en_US-lessac-medium"
  }'

Часто задаваемые вопросы

CosyVoice2 — модель клонирования с помощью текстового и голосового излучения следующего поколения из FunAudioLM (Aliba), которая поддерживает клонирование с нулевым голосом всего лишь с нескольких секунд эталонного аудио и может синтезировать естественную речь на китайском, английском, японском, корейском и кантонском языках. TextToSpeechAI вы можете запустить KosyVoice2 в браузере без какой-либо местной установки.

Да, CosyVoice2 полностью лицензирована Apache 2.0, как код, так и модель весов, что делает безопасным использование в коммерческих продуктах, платном содержании и работе с клиентами без лицензионных сборов или некоммерческих ограничений.

КосиВойце2 поддерживает пять языков: китайский (мандарин), английский, японский, корейский и кантонский. Он также занимается межязычным синтезом, так что вы можете клонировать голос с записи на одном языке и создавать речь на другом.

Поставьте 3-10 секунд чистого эталонного звука носителя. " CosyVoice2 " выведет характеристики носителя с использованием конечных методов квантизации скаляров, затем создадит новую речь в клонированном голосе на любом из его поддерживаемых языков.

CosyVoice2 — одна из более сильных многоязычных моделей клонирования, сохраняющая индивидуальность говорящего даже при подготовке речи на языке, отличном от справочного листа.

KosyVoice2 — это быстрая модель, включающая в себя режим ретрансляции, который производит аудио с низкой латентностью, что делает его пригодным для голосовых ассистентов и интерактивных приложений. TextToSpeechAI поколений обычно завершают в секундах для коротких текстов.

CosyVoice2 требует около 4-6GB из VRAM для модели параметра 0,5B, поэтому при самозаводе рекомендуется GPU с 6GB или более. На TextToSpeechAI модель работает на нашей инфраструктуре GPU, так что вам не нужно какое-либо собственное оборудование.

CosyVoice2 — модель высшего образования, стоящая 25 кредитов на 1000 символов текста. Каждый новый счет получает бесплатные стартеры, так что вы можете попробовать клонирование голоса KosyVoice2 перед тем, как принять решение о оплачиваемом плане.

Оба эти двигателя являются высококлассными двигателями клонирования голоса. ГИП-СОВИС часто достигают наивысшего первичного сходства для одного голоса, в то время как KosyVoice2 сильнее для многоязычного и межязычного клонирования и добавляет режим низколатного потока. Выберите CosyVoice2, когда вам нужен один клонированный голос, чтобы говорить на нескольких языках.

В обоих случаях используется высококачественное клонирование с нулевым голосом. " CosyVoice2 " поддерживает больше языков (5 против 2) и добавляется поток для использования в реальном времени, в то время как F5-TTS может быть несколько быстрее для работы только на английском языке. " CosyVoice2 " обычно лучше подходит для многоязычных проектов.

TextToSpeechAI позволяет экспортировать поколения KosyVoice2 в общих форматах, таких как MP3 и WAV. Вы можете загрузить файл непосредственно с вашей страницы истории или получить его программно через TextToSpeechAI API.

Да. Вы можете проверить KosyVoice2 на бесплатной демо- и бесплатных стартер-записях на TextToSpeechAI без установки ничего. Просто запишитесь, загрузите короткий клип, введите ваш текст на любом поддерживаемом языке и создайте.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try КоссиВойце2 Now

Generate your first audio free. No credit card required.

Start Free