Покет ТТС

Standard

Ултра леко клониране на гласа, което работи в реално време на процесора

Very Fast Скорост
Good Качество
Да. Клониране
2 Езици

За Покет ТТС

Pocket TTS от Kyutai е ултра лек 100M параметър текст-то-шпейх модел, който работи в реално време на процесора. Въпреки малкия си размер, той поддържа клониране на гласа от само 5 секунди референтен звук. Перфектен за разгръщане на ръба, мобилни приложения и сценарии, където ресурсите на GPU са ограничени. В момента поддържа английски и френски.

Ключови характеристики

Ултра леко

100M параметри - работи в реално време на процесора с минимални ресурси.

Гласово клониране

Клонирайте всеки глас от само 5 секунди от референтен звук, дори и на процесора.

Реално- време при процесор

Не се изисква GPU. Генерира реч при скорост в реално време на стандартен хардуер.

Готови за ръба

Достатъчно малки за мобилни устройства, Maline Pi и вградени системи.

Случаи за използване

Разпределяне на ръба и мобилния Гласови асистентки в реално време на процесора IoT и вградени устройства Гласово клониране с нисък източник

Как да използвате Покет ТТС

  1. 1

    Запишете се безплатно или опитайте демото

    Създаване на безплатен TextToSpeechAI акаунт, за да получите стартер кредити, или да използвате демото на място, за да чуете Pocket TTS преди да се регистрира. Не е необходимо GPU или местна инсталация.

  2. 2

    Изберете Pocket TTS и добавите глас към клониране

    Изберете Pocket TTS като вашия двигател, след това качи къс референтен клип от около 5 до 10 секунди, за да клонира този глас. Pocket TTS работи изцяло на CPU, така че клонирането е бързо и леко.

  3. 3

    Въведете вашия текст

    Напишете или вставете английски или френски текст, който искате да говорите. Дръжте под око броя на символите, тъй като Pocket TTS банкноти на стандартната ставка от 10 кредита на 1000 символа.

  4. 4

    Създаване на звука

    Кликнете върху генериране и Pocket TTS синтезира вашия текст в клонирания глас при скорост в реално време. Повечето клипове са готови в секунди, защото моделът е толкова малък и процесорно ефикасен.

  5. 5

    Изтеглете или използвайте API

    Изтеглете завършеното аудио или автоматизирано поколение през TextToSpeechAI REST API в api.texttospeechai.com с помощта на вашия акаунт жетон. API разкрива същите Pocket TTS клониране и синтез за вашите собствени приложения.

Покет ТТС API

Генерирайте речна програма с помощта на TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS осигурява гласово клониране, което тече в реално време, дори и при процесора.",
    "voice": "en_US-lessac-medium"
  }'

Често задавани въпроси

Pocket TTS е ултра лек текстов модел от Kyutai с само 100 милиона параметри. Той работи в реално време на CPU и поддържа клониране на гласа от 5 секунди от звук.

Pocket TTS е лицензиран по CC-BY-4.0, което позволява търговска употреба с акредитация. Трябва да се кредитира Kyutai при използването му в търговски приложения.

В момента Pocket TTS поддържа английски и френски. Още езици могат да бъдат добавени в бъдещите публикации.

Да! С само 100M параметри, Pocket TTS работи с реално време скорост на стандартен хардуер на CPU. Не е необходим GPU, което го прави идеален за разгръщане на ръба и мобилни приложения.

И двете са леки и работят добре на CPU. Pocket TTS уникално поддържа гласовото клониране (Kokoro не). Kokoro поддържа повече езици (9 vs 2). Изберете Pocket TTS, ако се нуждаете от леко клониране на гласа, Kokoro, ако се нуждаете от повече езиково покритие.

Осигурете 5 секунди референтен звук. Pocket TTS екстракти от езика характеристики и може да генерира нова реч в този глас. Качеството се подобрява с по-дълги препратки (до 10 секунди).

Да. За разлика от повечето модели на клониране, които изискват GPU, Pocket TTS извършва клониране с нулеви удари на гласа изцяло по CPU благодарение на малкия отпечатък от 100M параметър. Можете да клонирате глас от кратък клип дори на лаптоп или еднобордов компютър.

Pocket TTS е освободен под CC-BY-4.0, така че трябва да кредитирате Kyutai като оригинален създател, когато го използвате или преразпределите. Проста атрибуция като "Глас, генериран с Pocket TTS от Kyutai" отговаря на лиценза за търговска и нетърговска употреба, както.

Pocket TTS генерира реч в реално време или по-бързо на стандартен процесор, без GPU изискване. Това го прави един от най-отзивящите двигатели за нископозволено използване случаи като живи гласови асистентки и генериране на устройства.

Pocket TTS е в стандартния ценообразуващ ниво, което струва 10 кредита на 1000 символа. Това го прави един от най-икономичните възможности за клониране на гласа на TextToSpeechAI.

И двете са леки, приятни за процесора, стандартни двигатели. Изберете Pocket TTS, когато се нуждаете от клониране на гласа, тъй като Kokoro не го подкрепя. Изберете Kokoro, когато се нуждаете от по-широко езиково покритие и не се нуждаете от клониране на специфичен глас.

Да. Нови TextToSpeechAI акаунти получават безплатни стартер кредити, и демото на място ви позволява да чуете Pocket TTS преди да се ангажира. Регистрирайте се безплатно, качване на кратък референтен клип, и генерира клонирани реч в секунди.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Покет ТТС Now

Generate your first audio free. No credit card required.

Start Free