صندوق الدردشة

Premium

استنساخ الصوت بدون إصابة مع حديث تعبيري بـ 23 لغة

Fast السرعة
Very Good الجودة
نعم الاستنساخ
23 اللغات

عن صندوق الدردشة

Chatterbox is a powerful voice cloning TTS model from Resemble AI. It performs zero-shot voice cloning from just a few seconds of reference audio, supporting 23 languages with natural expression. Chatterbox includes paralinguistic tags for adding natural sounds like laughter and coughs to generated speech.

السمات الرئيسية

استنساخ الصوت

استنساخ أي صوت من بضعة ثوان من الصوت - لا يلزم تدريب.

23 لغة

من العربية إلى الصينية، وتغطي معظم لغات العالم الرئيسية.

علامات تعبيرية

أضف [ضحك]، [سعال]، [ضحك] للأصوات الطبيعية الشبه اللغوية.

الاستدلال السريع

مدة تأخير تقل عن 200 دقيقة مع المتغير Turbo للتطبيقات الزمنية الفعلية.

حالات الاستخدام

استنساخ الصوت من أجل إنشاء المحتوى التطبيقات الصوتية المتعددة اللغات تصميم صوت الشخصيات للألعاب مساعدون صويون شخصيون

كيف تستخدم صندوق الدردشة

  1. 1

    تسجيل أو فتح العرض

    إنشاء حساب مجاني TextToSpeechAI للمطالبة 200 ائتمانات البدء، أو استخدام العرض على الصفحة لتجربة Chatterbox دون التسجيل.

  2. 2

    انقر على Chatterbox وإضافة مقطع مرجعي

    اختار محرك Chatterbox، ثم قم بتحميل مقطع صوت قصير (بضعة ثوان) من الصوت الذي تريد استنساخه. Chatterbox zero-shot يستنسخه فوراً - لا يحتاج إلى تدريب.

  3. 3

    أدخل نصك مع علامات اختيارية

    كتابة أو لصق النص للتحدث بأي من اللغات الـ 23 المدعومة، وإسقاط [ضحك]، [سعال]، أو [ضحك] علامات حيثما تريد الأصوات الطبيعية شبه اللغوية.

  4. 4

    توليد الخطاب

    انقر على توليد و TextToSpeechAI يقوم بعرض نصك في صوت Chatterbox المستنسخ على البنية التحتية لمعالج الرسوميات المستضافة، بإنفاق 25 رصيد لكل 1000 رمز.

  5. 5

    تنزيل أو استخدام واجهة البرمجة التطبيقية

    تنزيل الملف الصوتي المنتهي، أو توليد آلي من خلال REST API TextToSpeechAI على api.texttospeechai.com باستخدام رمز حسابك.

صندوق الدردشة ألف - البرنامج المتقدم للتطبيق

توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "يمكن لـ Chatterbox استنساخ صوتك من مجرد بضعة ثوان من الصوت والتحدث بـ 23 لغة.",
    "voice": "en_US-lessac-medium"
  }'

الأسئلة المتكررة

إن "شاتربوكس" هو نموذج لتحويل النص إلى صوت من ريزيمبل آي. وهو قادر على تكرار أي صوت من مجرد بضعة ثوان من الصوت المرجعي وتوليد حديث طبيعي وتعبيري بثلاث وعشرين لغة، وكل هذا من دون أي تدريب على كل صوت على حدة.

نعم، تشاتربوكس مرخص بالكامل من قبل معهد ماساتشوستس للتكنولوجيا - كل من الشفرة وأوزان النموذج - لذلك يمكنك استخدامه بحرية في المنتجات التجارية. يتضمن الصوت المولد علامة مائية عصبية اختيارية يمكن تعطيلها، ولا توجد حقوق استخدام.

إنك تقدم مقطعاً مرجعياً قصيراً لأي صوت (بضعة ثوانٍ كافية) ويستخرج تشاتربوكس نغمة ذلك الصوت وأسلوبه في صورة متحدث مدمج. ثم يولد حديثاً جديداً تماماً في ذلك الصوت من دون أي ضبط دقيق أو خطوة تدريب، وهذا هو ما يعنيه "الضربة الصفرية".

تشاتربوكس يقرأ علامات خاصة في النص لإضافة أصوات طبيعية غير لفظية: [ضحك] يدخل ضحك، [سعال] يدخل سعال، و [ضحك] يدخل ضحك خفيف. فقط وضع علامة حيث تريد الصوت، على سبيل المثال "هذا مضحك [ضحك] ولكن بجدية...".

لقد وجدت عدة طرق لعمل ذلك فمثلا يمكنك كتابة العلامة مباشرة داخل نص المدخل في المكان الذي يجب ان يحدث فيه الصوت وتحيط به بقية جملتك. ان شاتربوكس يقوم بعرض الصوت الشبه لغوي في الصوت المستنسخ وخلطه مع الكلام المحيط بحيث يبدو عفوي بدلا من ان يكون ملفوف في الكلام.

يدعم برنامج تشاتربوكس 23 لغة، بما في ذلك العربية، والدنماركية، والألمانية، واليونانية، والإنجليزية، والإسبانية، والفنلندية، والفرنسية، والعبرية، والهندية، والإيطالية، واليابانية، والكورية، والمالايية، والهولندية، والنرويجية، والبولندية، والبرتغالية، والروسية، والسويدية، والسواحيلية، والتركية، والصينية، ويمكن لصوت مستنسخ واحد أن يتكلم عبر هذه اللغات.

إن برنامج Chatterbox يولد الكلام بسرعة على وحدة المعالجة المركزية، ويبلغ متغير توربو تأخيراً يقل عن 200 ميسلي ثانية للاستخدام في المحادثات في الوقت الحقيقي. والجودة جيدة للغاية، مع صوت طبيعي وإعادة إنتاج صوتي أمين حتى من مقاطع مرجعية قصيرة.

Chatterbox needs roughly 4-8GB of VRAM depending on the variant, with the Turbo model running comfortably in about 4GB. On TextToSpeechAI you do not need any local GPU - generation runs on our hosted infrastructure.

إن Chatterbox محرك من المستوى الأعلى سعراً يكلفك 25 نقطة لكل ألف كلمة. وتحصل الحسابات الجديدة على 200 نقطة مجانية لمحاولة استنساخ الصوت، ولا تنفق النقاط إلا على النص الذي تنتجه بالفعل.

وكل منهما يدعم استنساخ الصوت من دون طلقة، ولكن Chatterbox يغطي لغات أكثر بكثير (23 مقابل 2) ويضيف علامات تعبيرية. ويمكن لـ F5-TTS أن يزيد قليلاً من النغمة الإنجليزية الطبيعية، لذا اختر Chatterbox للاستنساخ المتعدد اللغات والأصوات التعبيرية، و F5-TTS للوفاء بالإنجليزية فقط.

يدعم Chatterbox 23 لغة وعلامات تعبيرية داخلية، في حين يضيف OpenVoice ضوابط نمط الصوت (الودي، الحزين، الغاضب، وأكثر) التي يفتقر إليها Chatterbox. اختار Chatterbox لتغطية واسعة النطاق للغات وأختار OpenVoice عندما تحتاج إلى نمط صوت عاطفي صريح.

نعم، انضم إلى حساب مجاني على TextToSpeechAI لتلقي 200 نقطة بداية، أو استخدم العرض على الصفحة للاستماع إلى Chatterbox دون التسجيل. قم بتحميل مقطع مرجعي قصير، وكتابة نصك، وإنشاء صوت مستنسخ في ثوان.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try صندوق الدردشة Now

Generate your first audio free. No credit card required.

Start Free