Покет ТТС
StandardУлтра леко клониране на гласа, което работи в реално време на процесора
За Покет ТТС
Pocket TTS от Kyutai е ултра лек 100M параметър текст-то-шпейх модел, който работи в реално време на процесора. Въпреки малкия си размер, той поддържа клониране на гласа от само 5 секунди референтен звук. Перфектен за разгръщане на ръба, мобилни приложения и сценарии, където ресурсите на GPU са ограничени. В момента поддържа английски и френски.
Ключови характеристики
Ултра леко
100M параметри - работи в реално време на процесора с минимални ресурси.
Гласово клониране
Клонирайте всеки глас от само 5 секунди от референтен звук, дори и на процесора.
Реално- време при процесор
Не се изисква GPU. Генерира реч при скорост в реално време на стандартен хардуер.
Готови за ръба
Достатъчно малки за мобилни устройства, Maline Pi и вградени системи.
Случаи за използване
Как да използвате Покет ТТС
-
1
Запишете се безплатно или опитайте демото
Създаване на безплатен TextToSpeechAI акаунт, за да получите стартер кредити, или да използвате демото на място, за да чуете Pocket TTS преди да се регистрира. Не е необходимо GPU или местна инсталация.
-
2
Изберете Pocket TTS и добавите глас към клониране
Изберете Pocket TTS като вашия двигател, след това качи къс референтен клип от около 5 до 10 секунди, за да клонира този глас. Pocket TTS работи изцяло на CPU, така че клонирането е бързо и леко.
-
3
Въведете вашия текст
Напишете или вставете английски или френски текст, който искате да говорите. Дръжте под око броя на символите, тъй като Pocket TTS банкноти на стандартната ставка от 10 кредита на 1000 символа.
-
4
Създаване на звука
Кликнете върху генериране и Pocket TTS синтезира вашия текст в клонирания глас при скорост в реално време. Повечето клипове са готови в секунди, защото моделът е толкова малък и процесорно ефикасен.
-
5
Изтеглете или използвайте API
Изтеглете завършеното аудио или автоматизирано поколение през TextToSpeechAI REST API в api.texttospeechai.com с помощта на вашия акаунт жетон. API разкрива същите Pocket TTS клониране и синтез за вашите собствени приложения.
Покет ТТС API
Генерирайте речна програма с помощта на TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS осигурява гласово клониране, което тече в реално време, дори и при процесора.",
"voice": "en_US-lessac-medium"
}'
Често задавани въпроси
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10