КоссиВойце2
PremiumКлонирование с нулевым числом голосовых сигналов при поддержке потокового потока
О том, что КоссиВойце2
CosyVoice2 — модель синтеза речи следующего поколения из FunAudioLM (Alibaba), которая обеспечивает естественное клонирование с нулевым звучанием голоса на нескольких языках с речевой способностью для прикладных программ с низкой степенью вероятности.
Основные характеристики
Клонирование нулевого голоса
Скажи любой голос с 3-10 секунд эталонного звука с высокой степенью верности.
Многоязычные
Поддерживает английский, китайский, японский, корейский и кантонский языки с синтезом.
Поддержка рядов
Режим низкоширотного направления для приложений в режиме реального времени и интерактивных систем.
Естественный прозодий
Усовершенствованные прозодиозные модели создают естественную трезвую речь с подходящим интонацией.
Использовать
Как пользоваться КоссиВойце2
-
1
Зарегистрируйтесь и подавайте бесплатную кредитку
Создать бесплатный TextToSpeechAI аккаунт, чтобы получить стартер-кредиты, или попробовать демо сначала. Не нужно установки GPU или местного KosyVoice2 - все работает на нашей инфраструктуре.
-
2
Выберите КозиВойце2 и добавьте клип
Выберите KosyVoice2 в качестве двигателя, затем загрузите чистую 3-10 секунду контрольного сигнала голоса, который вы хотите клонировать.
-
3
Введите текст на любом поддерживаемом языке
Напечатайте или вставьте ваш сценарий на китайском, английском, японском, корейском или кантонском языках.
-
4
Выстроить речь
Нажмите на кнопку "CosyVoice2" и синтезирует естественную многоязычную речь в клонированном голосе, обычно в течение секунд для короткого текста. Использование премиум-уровня стоит 25 титров на 1000 знаков.
-
5
Загрузка или использование API
Загрузить финальный звук в виде MP3 или WAV из вашей истории, или автоматизировать клонирование голоса KosyVoice2 в масштабе через TextToSpeechAI REST API.
КоссиВойце2 API
Создать речь программно используя TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "KosyVoice2 произносит естественную многоязычную речь с нулевым коэффициентом клонирования голоса.",
"voice": "en_US-lessac-medium"
}'
Часто задаваемые вопросы
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25