Карманные TTS

Standard

Клонирование голоса с помощью ультралегких голосов, которое работает в режиме реального времени на процессоре

Very Fast Скорость
Good Качество
Выполнено Клонирование
2 Знание языков

О том, что Карманные TTS

Pocket TTS Kyutai — модель с ультралегким весом в 100 м, которая работает в режиме реального времени на процессоре. Несмотря на ее маленький размер, она поддерживает клонирование голоса с пяти секунд эталонного аудио. Идеально для кромки, мобильных приложений и сценариев, где ресурсы GPU ограничены. В настоящее время поддерживает английский и французский.

Основные характеристики

Ультра-Лайтвес

Параметры 100М - работают в режиме реального времени на процессоре с минимальными ресурсами.

Голос

Скопировать любой голос с пяти секунд эталонного аудио, даже на процессор.

В реальном времени на процессоре

Не требуется ГИП.

Готовность к обряду

Достаточно маленький для мобильных устройств, "Рапберри Пи" и встроенных систем.

Использовать

Развертывание на обочине и мобильный :: Ассистент по голосовой связи в режиме реального времени в рамках процесса ИОТ и встроенные устройства Малоресурсное клонирование голоса

Как пользоваться Карманные TTS

  1. 1

    Подпишитесь бесплатно или попробуйте демо

    Создать бесплатный TextToSpeechAI аккаунт для получения стартер-кредитов или использовать демо для получения Pocket TTS перед подписанием. Не требуется ГПС или локальная установка.

  2. 2

    Выберите Pocket TTS и добавьте голос к клону

    Выберите Pocket TTS в качестве двигателя, затем загрузите короткий справочный клип продолжительностью от 5 до 10 секунд, чтобы клонировать этот голос. Pocket TTS работает полностью на процессоре, так что клонирование быстро и легко.

  3. 3

    Введите ваш текст

    Напечатайте или вставьте английский или французский текст, на котором вы хотите говорить. Следите за счетами персонажей, поскольку Pocket TTS купюры по стандартной ставке 10 титров на 1000 знаков.

  4. 4

    Создать звук

    Нажмите на кнопку и Pocket TTS синтезирует ваш текст в клонированном голосе при скорости в реальном времени. Большинство клипов готовы в секундах, потому что модель такая маленькая и эффективная.

  5. 5

    Загрузка или использование API

    Загрузить заключённое аудио, или автоматизировать поколение через TextToSpeechAI REST API на апи.textospeechai.com с помощью символа вашего счета. API разоблачает то же самое Pocket TTS клонирование и синтез для ваших собственных приложений.

Карманные TTS API

Создать речь программно используя TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Карманный TTS обеспечивает клонирование голоса, которое работает в реальном времени, даже на процессоре.",
    "voice": "en_US-lessac-medium"
  }'

Часто задаваемые вопросы

Pocket TTS — модель с ультралегким весом от киутай, имеющая только 100 миллионов параметров. Она работает в режиме реального времени на процессоре и поддерживает процессификацию голоса с 5 секунд звука.

Pocket TTS лицензирован на CC-BY-4.0, что позволяет коммерческое использование с присвоением. Вы должны заимствовать Kyutai при использовании в коммерческих приложениях.

В настоящее время Pocket TTS поддерживает английский и французский языки.

Да! Только 100 м параметров, Pocket TTS работает со скоростью в реальном времени на стандартном аппаратном аппарате процессора. ГПУ не требуется, чтобы сделать его идеальным для кромки и мобильных приложений.

Оба языка легковесны и хорошо работают на процессоре. Покер ТТС уникально поддерживает клонирование голоса (Кокоро не поддерживает). Кокоро поддерживает больше языков (9 против 2). Выберите Pocket TTS, если вам нужно легкое клонирование голоса, Кокоро, если вам нужно больше языкового охвата.

Улучшить качество при помощи более длительных ссылок (до 10 секунд).

В отличие от большинства моделей клонирования, требующих GPU, Pocket TTS осуществляет клонирование с нулевым голосом полностью на процессоре благодаря его крошечному следу в 100 м. Вы можете клонировать голос из короткого клипа даже на ноутбуке или однобортовом компьютере.

Pocket TTS выпускается под CC-BY-4.0, поэтому вы должны заимствовать Kyutai как оригинального создателя, когда вы используете его или перераспределяете. Простая атрибуция, например "Voice, созданной с Pocket TTS Kyutay", удовлетворяет лицензию как для коммерческого, так и для некоммерческого использования.

Pocket TTS создает речь в режиме реального времени или быстрее на стандартном процессоре, без необходимости ГПС. Это делает его одним из наиболее реагирующих двигателей для малоподвижных случаев использования, таких как ассистенты в прямом эфире и генерация настроек.

Pocket TTS находится в стандартном уровне цен, что стоит 10 кредитов на 1000 знаков, что делает его одним из наиболее экономичных вариантов голосовой клонирования на TextToSpeechAI.

Оба - легкие, удобные для процессора двигатели, стандартный уровень. Выбери покер ТТС, когда нужно клонирование голоса, поскольку Кокоро не поддерживает его. Выбери Кокоро, когда вам нужно расширить языковой охват и не нужно клонировать конкретный голос.

Новые счета TextToSpeechAI получают бесплатные стартеры, и демо на месте позволяет вам услышать Pocket TTS перед началом. Запишитесь бесплатно, загрузите короткий клип и спровоцировать клонированную речь в секунды.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Карманные TTS Now

Generate your first audio free. No credit card required.

Start Free