أجهزة جيب TTS

Standard

استنساخ صوت خفيف للغاية يعمل في الوقت الحقيقي على وحدة المعالجة المركزية

Very Fast السرعة
Good الجودة
نعم الاستنساخ
2 اللغات

عن أجهزة جيب TTS

Pocket TTS by Kyutai is an ultra-lightweight 100M parameter text-to-speech model that runs in real-time on CPU. Despite its tiny size, it supports voice cloning from just 5 seconds of reference audio. Perfect for edge deployment, mobile applications, and scenarios where GPU resources are limited. Currently supports English and French.

السمات الرئيسية

الخفيفة جدا

100M البارامترات - يعمل في الوقت الحقيقي على وحدة المعالجة المركزية مع الحد الأدنى من الموارد.

استنساخ الصوت

استنساخ أي صوت من مجرد 5 ثوان من الصوت المرجعي، حتى على وحدة المعالجة المركزية.

الوقت الحقيقي على وحدة المعالجة المركزية

لا يحتاج إلى وحدة معالجة رسومية، يولد الكلام بسرعة الوقت الحقيقي على المعدات القياسية.

جاهز للاستخدام

صغير بما فيه الكفاية للأجهزة المحمولة، و Raspberry Pi، والنظم المدمجة.

حالات الاستخدام

النشر الطرفي والمتنقل مساعدون صويون في الوقت الحقيقي على وحدة المعالجة المركزية IoT and embedded devices استنساخ الصوت المنخفض الموارد

كيف تستخدم أجهزة جيب TTS

  1. 1

    تسجيل مجاني أو تجربة العرض

    إنشاء حساب مجاني TextToSpeechAI لتلقي ائتمانات البدء، أو استخدام العرض في الموقع للاستماع إلى Pocket TTS قبل التسجيل. لا GPU أو التركيب المحلي مطلوب.

  2. 2

    انقر على Pocket TTS و أضف صوتاً للاستنساخ

    اختار Pocket TTS كمحركك، ثم قم بتحميل مقطع مرجعي قصير من حوالي 5 إلى 10 ثوان لاستنساخ ذلك الصوت. Pocket TTS يعمل بالكامل على وحدة المعالجة المركزية، لذا فإن الاستنساخ سريع وخفيف.

  3. 3

    أدخل نصك

    10- يرجى كتابة أو لصق النص الإنكليزي أو الفرنسي الذي تريد أن يقال، مع الحرص على عدد الحروف، لأن برنامج Pocket TTS يحسب الفواتير بالمعدل القياسي وهو 10 وحدات لكل 000 1 كلمة.

  4. 4

    صنع الصوت

    انقر على توليد و Pocket TTS يقوم بتوليف نصك في الصوت المستنسخ بسرعة الوقت الحقيقي معظم المقاطع جاهزة في ثوان لأن النموذج صغير جدا و فعال من حيث معالجة البيانات

  5. 5

    تنزيل أو استخدام واجهة البرمجة التطبيقية

    تحميل الصوت المنتهي، أو أتمتة توليد من خلال REST API TextToSpeechAI في api.texttospeechai.com باستخدام رمز حسابك. API يعرض نفس Pocket TTS استنساخ وتركيب لتطبيقاتك الخاصة.

أجهزة جيب TTS ألف - البرنامج المتقدم للتطبيق

توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS يقدم استنساخ الصوت الذي يعمل في الوقت الحقيقي، حتى على وحدة المعالجة المركزية.",
    "voice": "en_US-lessac-medium"
  }'

الأسئلة المتكررة

Pocket TTS هو نموذج خفيف للغاية لتحويل النص إلى كلمة من Kyutai مع 100 مليون بارامترات فقط، وهو يعمل في الوقت الحقيقي على وحدة المعالجة المركزية ويدعم استنساخ الصوت من 5 ثوان من الصوت.

Pocket TTS مرخص تحت CC-BY-4.0، الذي يسمح بالاستخدام التجاري مع الإشارة إلى مصدره. يجب أن تشير إلى مصدر Kyutai عند استخدامه في التطبيقات التجارية.

ويدعم برنامج Pocket TTS حاليا اللغتين الإنكليزية والفرنسية، وقد يضاف المزيد من اللغات في الإصدارات المقبلة.

نعم، مع 100 مليون بارامترات فقط، يعمل Pocket TTS بسرعة الوقت الحقيقي على أجهزة المعالجة المركزية العادية. لا توجد حاجة إلى وحدة المعالجة الرسومية، مما يجعله مثالياً لنشر الحافة والتطبيقات المحمولة.

كلاهما خفيف الوزن ويعمل بشكل جيد على وحدة المعالجة المركزية. يدعم Pocket TTS بشكل فريد استنساخ الصوت (Kokoro لا يدعمه). Kokoro يدعم لغات أكثر (9 مقابل 2). اختر Pocket TTS إذا كنت بحاجة إلى استنساخ صوت خفيف، Kokoro إذا كنت بحاجة إلى تغطية لغة أكثر.

توفر 5 ثوان من الصوت المرجعي. يقوم Pocket TTS باستخراج خصائص المتكلم ويمكنه توليد حديث جديد في ذلك الصوت. تتحسن الجودة مع المراجع الأطول (حتى 10 ثوان).

نعم، على عكس أغلب نماذج الاستنساخ التي تتطلب وحدة معالجة رسومية، فإن برنامج Pocket TTS يقوم باستنساخ الصوت من الصفر بالكامل على وحدة المعالجة المركزية بفضل مساحة 100 ميجا بارامتر صغيرة. ويمكنك استنساخ صوت من مقطع قصير حتى على كمبيوتر محمول أو حاسوب أحادي اللوح.

يصدر Pocket TTS تحت رخصة CC-BY-4.0، لذا يجب عليك أن تذكر كيوتاي باعتباره المبدعا الأصليا عند استخدامه أو إعادة توزيعه. إن ذكر صوت بسيط مثل "صوت تم توليده باستخدام Pocket TTS بواسطة Kyutai" يفي بالرخص للاستخدام التجاري وغير التجاري على حد سواء.

يقوم Pocket TTS بتوليد الكلام في الوقت الحقيقي أو أسرع على وحدة معالجة مركزية قياسية، دون الحاجة إلى وحدة معالجة رسومية. وهذا يجعله أحد أكثر المحركات استجابة لحالات الاستخدام المنخفضة التأخير مثل المساعدين الصوتيين الحيين والتوليد على الجهاز.

برامج تحويل الصوت إلى نص في الجيب هي في مستوى التسعير القياسي، بتكلفة 10 أرصدة لكل 1000 حرف، وهذا يجعلها واحدة من أكثر خيارات استنساخ الصوت اقتصادية المتاحة على TextToSpeechAI.

كلاهما محركان خفيف الوزن، وصديقي المعالج، ومحركان من المستوى القياسي. اختر Pocket TTS عندما تحتاج إلى استنساخ الصوت، لأن كوكورو لا يدعمه. اختر كوكورو عندما تحتاج إلى تغطية لغة أوسع ولا تحتاج إلى استنساخ صوت محدد.

نعم، يحصل TextToSpeechAI حساب جديد على ائتمانات بدء مجانية، ويسمح لك العرض التجريبي في الموقع بالاستماع إلى Pocket TTS قبل الالتزام. انضم مجاناً، ورفِّع مقطع مرجعي قصير، واختر لغة مستنسخة في ثوان.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try أجهزة جيب TTS Now

Generate your first audio free. No credit card required.

Start Free