جیبی TTS

Standard

شبیه‌سازی صدای فوق سبک که در زمان واقعی روی CPU اجرا می‌شود

Very Fast سرعت

Good کیفیت

آره شبیه‌سازی

2 زبانها

در مورد جیبی TTS

Pocket TTS by Kyutai is an ultra-lightweight 100M parameter text-to-speech model that runs in real-time on CPU. Despite its tiny size, it supports voice cloning from just 5 seconds of reference audio. Perfect for edge deployment, mobile applications, and scenarios where GPU resources are limited. Currently supports English and French.

ویژگیهای کلیدی

سبک‌بار

100M پارامترها - در زمان واقعی بر روی CPU با منابع کم اجرا می‌شود.

شبیه‌سازی صدا

هر صدایی را از تنها ۵ ثانیه صدای مرجع، حتی روی CPU، کپی کنید.

زمان واقعی در پردازنده

GPU مورد نیاز نیست. گفتار را با سرعت زمان واقعی بر روی سخت‌افزار استاندارد تولید می‌کند.

آماده برای لبه‌ها

به اندازه کافی کوچک برای دستگاه‌های موبایل، رزبری پای و سیستم‌های جاسازی شده.

موارد استفاده

انتشار Edge و Mobile کمک‌کننده‌های صدای زمان واقعی در پردازنده IoT و دستگاه‌های جاسازی شده شبیه‌سازی صدای کم‌مورد

چطور استفاده شود جیبی TTS

1

ثبت نام رایگان یا آزمایش نمایشی

Create a free TextToSpeechAI account to receive starter credits, or use the on-site demo to hear Pocket TTS before signing up. No GPU or local install is needed.
2

انتخاب Pocket TTS و افزودن یک صدا برای شبیه‌سازی

Pocket TTS را به عنوان موتور خود انتخاب کنید ، سپس یک کلیپ مرجع کوتاه حدود ۵ تا ۱۰ ثانیه را برای شبیه‌سازی آن صدا بارگذاری کنید. Pocket TTS کاملاً بر روی CPU اجرا می‌شود ، بنابراین شبیه‌سازی سریع و سبک است.
3

وارد کردن متن

متن انگلیسی یا فرانسوی را که می‌خواهید به صورت گفتاری بشنوید تایپ یا بچسبانید. به تعداد کاراکترها توجه داشته باشید ، زیرا Pocket TTS با نرخ استاندارد ۱۰ کرون در هر ۱۰۰۰ کاراکتر حساب می‌کند.
4

تولید صدا

کلیک کنید برای تولید و Pocket TTS متن شما را در صدای شبیه سازی شده با سرعت همزمان ترکیب می‌کند. بیشتر کلیپ‌ها در چند ثانیه آماده می‌شوند زیرا مدل بسیار کوچک و کارآمد CPU است.
5

دانلود یا استفاده از API

دانلود صوت نهایی، یا خودکارسازی تولید از طریق TextToSpeechAI REST API در api.texttospeechai.com با استفاده از توکن حساب خود.

جیبی TTS API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS شبیه‌سازی صدا را ارائه می‌دهد که در زمان واقعی اجرا می‌شود، حتی در CPU.",
    "voice": "en_US-lessac-medium"
  }'

خواندن مستندات API کلید API خود را دریافت کنید

پرسشهای متداول

Pocket TTS یک مدل متن به گفتار فوق سبک از Kyutai با تنها ۱۰۰ میلیون پارامتر است. این در زمان واقعی بر روی CPU اجرا می‌شود و از شبیه‌سازی صدا از ۵ ثانیه صدا پشتیبانی می‌کند.

Pocket TTS تحت مجوز CC-BY-4.0 است که استفاده تجاری را با ذکر منبع اجازه می‌دهد. هنگام استفاده از آن در برنامه‌های تجاری باید به Kyutai اشاره کنید.

در حال حاضر Pocket TTS از انگلیسی و فرانسوی پشتیبانی می‌کند. ممکن است در نسخه‌های آینده زبان‌های بیشتری اضافه شود.

بله! با تنها ۱۰۰M پارامتر، Pocket TTS با سرعت زمان واقعی روی سخت‌افزار CPU استاندارد اجرا می‌شود. هیچ GPU مورد نیاز نیست، که آن را برای پیاده‌سازی لبه و برنامه‌های کاربردی موبایل ایده‌آل می‌کند.

هر دو سبک هستند و در پردازنده به خوبی اجرا می‌شوند. Pocket TTS به طور منحصربه‌فرد از شبیه‌سازی صدا پشتیبانی می‌کند (Kokoro نمی‌کند). Kokoro از زبان‌های بیشتری پشتیبانی می‌کند (۹ در مقابل ۲). اگر به شبیه‌سازی صدای سبک نیاز دارید ، Pocket TTS را انتخاب کنید ، اگر به پوشش بیشتر زبان نیاز دارید ، Kokoro را انتخاب کنید.

ارائه ۵ ثانیه از صدای مرجع. Pocket TTS ویژگی‌های سخنران را استخراج می‌کند و می‌تواند گفتار جدیدی را در آن صدا تولید کند. کیفیت با مرجع‌های طولانی‌تر بهبود می‌یابد (تا ۱۰ ثانیه).

بله. برخلاف بیشتر مدل‌های شبیه‌سازی که نیازمند یک GPU هستند، Pocket TTS شبیه‌سازی صدای صفر-شلیک را به لطف فضای کوچک پارامترهای ۱۰۰M خود، به‌طور کامل در CPU انجام می‌دهد. شما می‌توانید صدایی را از یک کلیپ کوتاه حتی در یک لپ‌تاپ یا کامپیوتر تک‌کارت شبیه‌سازی کنید.

Pocket TTS تحت مجوز CC-BY-4.0 منتشر شده‌است، بنابراین هنگام استفاده یا توزیع مجدد آن باید به Kyutai به عنوان خالق اصلی اشاره کنید. یک اشاره ساده مانند "صدا تولید شده با Pocket TTS توسط Kyutai" مجوز را برای استفاده تجاری و غیر تجاری یکسان برآورده می‌کند.

Pocket TTS گفتار را در زمان واقعی یا سریعتر بر روی یک CPU استاندارد تولید می‌کند، بدون نیاز به GPU.این باعث می‌شود که یکی از پاسخگوترین موتورها برای موارد استفاده با تأخیر کم مانند کمک‌های صوتی زنده و تولید بر روی دستگاه باشد.

Pocket TTS is in the standard pricing tier, costing 10 credits per 1,000 characters. That makes it one of the most economical voice-cloning options available on TextToSpeechAI.

هر دو موتور سبک ، CPU- friendly ، استاندارد- Tier هستند. هنگامی که به شبیه‌سازی صدا نیاز دارید ، Pocket TTS را انتخاب کنید ، زیرا Kokoro از آن پشتیبانی نمی‌کند. هنگامی که به پوشش گسترده‌تر زبان نیاز دارید و نیازی به شبیه‌سازی یک صدای خاص ندارید ، Kokoro را انتخاب کنید.

بله. حساب هاي جديد TextToSpeechAI اعتبار شروع مجاني مي گيرند و نمايشگاه مجازي به شما اجازه مي دهد قبل از شروع به کار به Pocket TTS گوش دهيد. مجاني ثبت نام کنيد، يک کليپ مرجع کوتاه را بارگيري کنيد و در چند ثانيه گفتار شبيه سازي شده اي توليد کنيد.

Technical Specs

Generation Speed Very Fast
Output Quality Good
Voice Cloning Supported
Languages 2
GPU VRAM CPU OK
Credits/1000 chars 10

Try جیبی TTS Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

جیبی TTS

در مورد جیبی TTS

ویژگیهای کلیدی

سبک‌بار

شبیه‌سازی صدا

زمان واقعی در پردازنده

آماده برای لبه‌ها

موارد استفاده

چطور استفاده شود جیبی TTS

ثبت نام رایگان یا آزمایش نمایشی

انتخاب Pocket TTS و افزودن یک صدا برای شبیه‌سازی

وارد کردن متن

تولید صدا

دانلود یا استفاده از API

جیبی TTS API

پرسشهای متداول

جعبه TTS چیست؟

نت‌فلیکس برای استفاده تجاری رایگان است.

زبان فارسی از چه زبان‌هایی پشتیبانی می‌کند؟

آیا Pocket TTS واقعاً روی CPU کار می‌کند؟

کوکورو چیه؟

چگونه کپی صدا در Pocket TTS کار می‌کند؟

آیا Pocket TTS می‌تواند صداها را روی CPU کپی کند؟

تابع تابعی است که تابع T را به دست می‌دهد.

جعبه TTS چقدر سریع است؟

يه TextToSpeechAI با "پکپ" چقدر پول مياره؟

کوکورو: کدامیک را انتخاب کنم؟

ميشه مجاني روي TextToSpeechAI از Pocket TTS استفاده کنم؟

Technical Specs

Try جیبی TTS Now

Other TTS Engines

پوست

جعبه گفتگو

صدای دلنشین ۲Name