جیبی TTS

Standard

شبیه‌سازی صدای فوق سبک که در زمان واقعی روی CPU اجرا می‌شود

Very Fast سرعت
Good کیفیت
آره شبیه‌سازی
2 زبانها

در مورد جیبی TTS

Pocket TTS by Kyutai is an ultra-lightweight 100M parameter text-to-speech model that runs in real-time on CPU. Despite its tiny size, it supports voice cloning from just 5 seconds of reference audio. Perfect for edge deployment, mobile applications, and scenarios where GPU resources are limited. Currently supports English and French.

ویژگیهای کلیدی

سبک‌بار

100M پارامترها - در زمان واقعی بر روی CPU با منابع کم اجرا می‌شود.

شبیه‌سازی صدا

هر صدایی را از تنها ۵ ثانیه صدای مرجع، حتی روی CPU، کپی کنید.

زمان واقعی در پردازنده

GPU مورد نیاز نیست. گفتار را با سرعت زمان واقعی بر روی سخت‌افزار استاندارد تولید می‌کند.

آماده برای لبه‌ها

به اندازه کافی کوچک برای دستگاه‌های موبایل، رزبری پای و سیستم‌های جاسازی شده.

موارد استفاده

انتشار Edge و Mobile کمک‌کننده‌های صدای زمان واقعی در پردازنده IoT و دستگاه‌های جاسازی شده شبیه‌سازی صدای کم‌مورد

چطور استفاده شود جیبی TTS

  1. 1

    ثبت نام رایگان یا آزمایش نمایشی

    Create a free TextToSpeechAI account to receive starter credits, or use the on-site demo to hear Pocket TTS before signing up. No GPU or local install is needed.

  2. 2

    انتخاب Pocket TTS و افزودن یک صدا برای شبیه‌سازی

    Pocket TTS را به عنوان موتور خود انتخاب کنید ، سپس یک کلیپ مرجع کوتاه حدود ۵ تا ۱۰ ثانیه را برای شبیه‌سازی آن صدا بارگذاری کنید. Pocket TTS کاملاً بر روی CPU اجرا می‌شود ، بنابراین شبیه‌سازی سریع و سبک است.

  3. 3

    وارد کردن متن

    متن انگلیسی یا فرانسوی را که می‌خواهید به صورت گفتاری بشنوید تایپ یا بچسبانید. به تعداد کاراکترها توجه داشته باشید ، زیرا Pocket TTS با نرخ استاندارد ۱۰ کرون در هر ۱۰۰۰ کاراکتر حساب می‌کند.

  4. 4

    تولید صدا

    کلیک کنید برای تولید و Pocket TTS متن شما را در صدای شبیه سازی شده با سرعت همزمان ترکیب می‌کند. بیشتر کلیپ‌ها در چند ثانیه آماده می‌شوند زیرا مدل بسیار کوچک و کارآمد CPU است.

  5. 5

    دانلود یا استفاده از API

    دانلود صوت نهایی، یا خودکارسازی تولید از طریق TextToSpeechAI REST API در api.texttospeechai.com با استفاده از توکن حساب خود.

جیبی TTS API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS شبیه‌سازی صدا را ارائه می‌دهد که در زمان واقعی اجرا می‌شود، حتی در CPU.",
    "voice": "en_US-lessac-medium"
  }'

پرسشهای متداول

Pocket TTS یک مدل متن به گفتار فوق سبک از Kyutai با تنها ۱۰۰ میلیون پارامتر است. این در زمان واقعی بر روی CPU اجرا می‌شود و از شبیه‌سازی صدا از ۵ ثانیه صدا پشتیبانی می‌کند.

Pocket TTS تحت مجوز CC-BY-4.0 است که استفاده تجاری را با ذکر منبع اجازه می‌دهد. هنگام استفاده از آن در برنامه‌های تجاری باید به Kyutai اشاره کنید.

در حال حاضر Pocket TTS از انگلیسی و فرانسوی پشتیبانی می‌کند. ممکن است در نسخه‌های آینده زبان‌های بیشتری اضافه شود.

بله! با تنها ۱۰۰M پارامتر، Pocket TTS با سرعت زمان واقعی روی سخت‌افزار CPU استاندارد اجرا می‌شود. هیچ GPU مورد نیاز نیست، که آن را برای پیاده‌سازی لبه و برنامه‌های کاربردی موبایل ایده‌آل می‌کند.

هر دو سبک هستند و در پردازنده به خوبی اجرا می‌شوند. Pocket TTS به طور منحصربه‌فرد از شبیه‌سازی صدا پشتیبانی می‌کند (Kokoro نمی‌کند). Kokoro از زبان‌های بیشتری پشتیبانی می‌کند (۹ در مقابل ۲). اگر به شبیه‌سازی صدای سبک نیاز دارید ، Pocket TTS را انتخاب کنید ، اگر به پوشش بیشتر زبان نیاز دارید ، Kokoro را انتخاب کنید.

ارائه ۵ ثانیه از صدای مرجع. Pocket TTS ویژگی‌های سخنران را استخراج می‌کند و می‌تواند گفتار جدیدی را در آن صدا تولید کند. کیفیت با مرجع‌های طولانی‌تر بهبود می‌یابد (تا ۱۰ ثانیه).

بله. برخلاف بیشتر مدل‌های شبیه‌سازی که نیازمند یک GPU هستند، Pocket TTS شبیه‌سازی صدای صفر-شلیک را به لطف فضای کوچک پارامترهای ۱۰۰M خود، به‌طور کامل در CPU انجام می‌دهد. شما می‌توانید صدایی را از یک کلیپ کوتاه حتی در یک لپ‌تاپ یا کامپیوتر تک‌کارت شبیه‌سازی کنید.

Pocket TTS تحت مجوز CC-BY-4.0 منتشر شده‌است، بنابراین هنگام استفاده یا توزیع مجدد آن باید به Kyutai به عنوان خالق اصلی اشاره کنید. یک اشاره ساده مانند "صدا تولید شده با Pocket TTS توسط Kyutai" مجوز را برای استفاده تجاری و غیر تجاری یکسان برآورده می‌کند.

Pocket TTS گفتار را در زمان واقعی یا سریعتر بر روی یک CPU استاندارد تولید می‌کند، بدون نیاز به GPU.این باعث می‌شود که یکی از پاسخگوترین موتورها برای موارد استفاده با تأخیر کم مانند کمک‌های صوتی زنده و تولید بر روی دستگاه باشد.

Pocket TTS is in the standard pricing tier, costing 10 credits per 1,000 characters. That makes it one of the most economical voice-cloning options available on TextToSpeechAI.

هر دو موتور سبک ، CPU- friendly ، استاندارد- Tier هستند. هنگامی که به شبیه‌سازی صدا نیاز دارید ، Pocket TTS را انتخاب کنید ، زیرا Kokoro از آن پشتیبانی نمی‌کند. هنگامی که به پوشش گسترده‌تر زبان نیاز دارید و نیازی به شبیه‌سازی یک صدای خاص ندارید ، Kokoro را انتخاب کنید.

بله. حساب هاي جديد TextToSpeechAI اعتبار شروع مجاني مي گيرند و نمايشگاه مجازي به شما اجازه مي دهد قبل از شروع به کار به Pocket TTS گوش دهيد. مجاني ثبت نام کنيد، يک کليپ مرجع کوتاه را بارگيري کنيد و در چند ثانيه گفتار شبيه سازي شده اي توليد کنيد.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try جیبی TTS Now

Generate your first audio free. No credit card required.

Start Free