Карманные TTS
StandardКлонирование голоса с помощью ультралегких голосов, которое работает в режиме реального времени на процессоре
О том, что Карманные TTS
Pocket TTS Kyutai — модель с ультралегким весом в 100 м, которая работает в режиме реального времени на процессоре. Несмотря на ее маленький размер, она поддерживает клонирование голоса с пяти секунд эталонного аудио. Идеально для кромки, мобильных приложений и сценариев, где ресурсы GPU ограничены. В настоящее время поддерживает английский и французский.
Основные характеристики
Ультра-Лайтвес
Параметры 100М - работают в режиме реального времени на процессоре с минимальными ресурсами.
Голос
Скопировать любой голос с пяти секунд эталонного аудио, даже на процессор.
В реальном времени на процессоре
Не требуется ГИП.
Готовность к обряду
Достаточно маленький для мобильных устройств, "Рапберри Пи" и встроенных систем.
Использовать
Как пользоваться Карманные TTS
-
1
Подпишитесь бесплатно или попробуйте демо
Создать бесплатный TextToSpeechAI аккаунт для получения стартер-кредитов или использовать демо для получения Pocket TTS перед подписанием. Не требуется ГПС или локальная установка.
-
2
Выберите Pocket TTS и добавьте голос к клону
Выберите Pocket TTS в качестве двигателя, затем загрузите короткий справочный клип продолжительностью от 5 до 10 секунд, чтобы клонировать этот голос. Pocket TTS работает полностью на процессоре, так что клонирование быстро и легко.
-
3
Введите ваш текст
Напечатайте или вставьте английский или французский текст, на котором вы хотите говорить. Следите за счетами персонажей, поскольку Pocket TTS купюры по стандартной ставке 10 титров на 1000 знаков.
-
4
Создать звук
Нажмите на кнопку и Pocket TTS синтезирует ваш текст в клонированном голосе при скорости в реальном времени. Большинство клипов готовы в секундах, потому что модель такая маленькая и эффективная.
-
5
Загрузка или использование API
Загрузить заключённое аудио, или автоматизировать поколение через TextToSpeechAI REST API на апи.textospeechai.com с помощью символа вашего счета. API разоблачает то же самое Pocket TTS клонирование и синтез для ваших собственных приложений.
Карманные TTS API
Создать речь программно используя TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Карманный TTS обеспечивает клонирование голоса, которое работает в реальном времени, даже на процессоре.",
"voice": "en_US-lessac-medium"
}'
Часто задаваемые вопросы
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10