القشرة

Premium

لغة تعبيرية للذكاء الاصطناعي مع المشاعر والتأثيرات الصوتية

Slow السرعة
Very Good الجودة
لا الاستنساخ
13 اللغات

عن القشرة

s of speech that are not heard by humans. Bark is a

السمات الرئيسية

التعبير العاطفي

تحدث بضحك، وتنين، وتهدئة، ومشاعر حقيقية.

مؤشرات العاطفة

استخدم [ضحك]، [تنانه]، حروفاً كبيرة للتأكيد، و... للتردد.

تعدد اللغات

يدعم 13+ لغات مع لهجات طبيعية والنطق.

الموسيقى والتأثيرات

يمكن أن يولد موسيقى بسيطة وأصوات بيئية.

المتحدثين المسبقة

عدة أصوات متكلمين مدربين مسبقاً بأساليب مختلفة.

المصدر المفتوح

MIT مرخص مع حقوق الاستخدام التجاري الكامل.

حالات الاستخدام

حوار الشخصيات المحتوى المتحرك سرد الكتب السمعية التمثيل الصوتي المشاريع الإبداعية مساعدون تعبيريون

القشرة Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

كيف تستخدم القشرة

  1. 1

    انضم مجانا وفتح العرض

    إنشاء حساب مجاني TextToSpeechAI للمطالبة ببدء الائتمانات، أو استخدام العرض التجريبي بدون التسجيل لتجربة Bark على الفور. الائتمانات المجانية كافية لإنتاج عدة مقاطع تعبيرية Bark قبل أن تقوم بالترقية.

  2. 2

    اختار صوت النباح

    افتح مكتبة الصوت وانتخب متحدث صوت يرقة مسبق التحديد يطابق النبرة التي تريد. صوت يرقة يوضع عليه علامة على أنه من المستوى الأعلى (25 نقطة لكل 1000 حرف) ويتم ضبطه للرواية العاطفية، على غرار الشخصيات.

  3. 3

    أدخل نصاً مع علامات العواطف

    ضع النص الخاص بك و ادمج علامات المشاعر في السطر: [ضحك] للضحك، [ضحك] للانتعاش، [هباء] للهباء،... للتوقف، و CAPS للتأكيد. على سبيل المثال: "أوه واو! [ضحك] هذا مدهش... لا أستطيع تصديقه!"

  4. 4

    صنع الصوت

    انقر على توليد و يقوم Bark بتحويل نصك إلى كلام تعبيري، و يحول كل علامة إلى الصوت المطابق. التوليد أبطأ من المحركات الخفيفة بسبب نموذج محول Bark، لذلك يسمح ببضعة ثوان إضافية لكل جملة.

  5. 5

    تنزيل أو استخدام واجهة البرمجة التطبيقية

    لقد وجدت عدة طرق لتحسين جودة الصوت. فمن خلال تشغيل صوت Bark، يمكنك إنشاء صوت فريد من نوعه. يمكنك الحصول على صوت Bark من خلال تشغيل صوت Bark في تطبيقك الخاص، واستدعاء واجهة برك TextToSpeechAI API بصوت Bark ونفس النص الغني بالعلامات لاستعادة الصوت التعبيري.

القشرة ألف - البرنامج المتقدم للتطبيق

توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "هذا مدهش أنا أحب كيف يبدو هذا التعبير",
    "voice": "bark-zh_0"
  }'

الأسئلة المتكررة

وعلى عكس أنظمة تحويل النص إلى صوت التقليدية، فإن نموذج "بارك" ينتج لغة تعبيرية للغاية تتضمن مشاعر طبيعية، وضحكات، واعتناقات، وغيرها من الأصوات غير اللفظية. بل إنه قادر على توليد الموسيقى والمؤثرات الصوتية.

نعم، بارك مفتوح المصدر تحت ترخيص معهد ماساتشوستس للتكنولوجيا، مما يسمح بالاستخدام التجاري المجاني. على TextToSpeechAI، نحن نحمّل 25 نقطة لكل 1000 حرف بسبب الموارد الكبيرة لمعالج الرسوميات المطلوبة للتوليد.

يدعم برك 13+ لغات بما في ذلك الإنجليزية، الألمانية، الإسبانية، الفرنسية، الهندية، الإيطالية، اليابانية، الكورية، البولندية، البرتغالية، الروسية، التركية، والصينية. كل لغة لها نطق طبيعي ولهجات.

Bark أبطأ من معظم محركات TTS بسبب بنية المحول الذاتي التراجعي. الجملة النموذجية تستغرق 5-15 ثانية لتوليد على GPU. والمقايضات هي بشكل ملحوظ أكثر تعبيرا ومخرج طبيعي.

يقدم Bark نسخة صوتية محدودة فقط من خلال "النداءات الدلالية" ومسبقات المتحدث، لذلك لا يمكنه أن يستنسخ بشكل موثوق صوتًا تعسفيًا من عينة. إذا كان استنساخ الصوت الكامل هو هدفك، فاستخدم F5-TTS، StyleTTS2، OpenVoice، أو Tortoise بدلاً من ذلك، وجميعها متاحة على TextToSpeechAI.

Bark يقرأ العلامات الموجودة في السطر والموضوعة مباشرة في نصك ويحولها إلى أصوات مطابقة. استخدم [ضحك] للضحك، [ضحك] للنهدوء، [هدوء] للهدوء،... للتردد أو التوقف، و CAPS للتأكيد. مثال: "أوه واو! [ضحك] هذا مدهش... لا أستطيع تصديقه!"

وبعيداً عن الكلام العادي، يستطيع بارك أن ينتج أصواتاً غير لفظية مثل الضحك، والانتعاش، والتنفس، وتطهير الحلق، والجمل، فضلاً عن الموسيقى البسيطة والتأثيرات البيئية. ويتم إطلاق هذه الأصوات باستخدام علامات مثل [ضحك]، [انتعاش]، و[تنفس] مدمجة في النص، وهو ما يجعل بارك يشعر بأنه أكثر تعبيراً من الترجمة التلقائية النموذجية.

ينتج Bark صوتاً جيداً جداً بتعبير طبيعي يتنافس مع الكلام البشري من حيث المحتوى العاطفي. ويبدو مخرج 24 كيلوهرتز مهنياً، على الرغم من أن جودة الكلام النقي أقل قليلاً من StyleTTS2.

يتطلب Bark 8-12 جيجا بايت من ذاكرة العرض التفاعلي (VRAM) اعتمادا على حجم النموذج. ويحتاج النموذج الكامل إلى ~12 جيجا بايت، بينما تعمل الأشكال الأصغر حجما بـ 8 جيجا بايت.

نعم، برك مرخص من قبل معهد ماساتشوستس للتكنولوجيا، مما يسمح بالاستخدام التجاري غير المقيد دون رسوم ترخيص. يمكنك استخدام برك في المنتجات، والخدمات، والتطبيقات بحرية. على TextToSpeechAI يمكنك تجربة برك مجانا باستخدام ائتمانات التسجيل الخاصة بك قبل دفع المزيد.

يتميز بارك في الكلام التعبيري للمتحدث الواحد مع علامات العاطفة مثل [ضحك] و [انتفاخات] ، في حين أن ديا مصنوعة للحوار المتعدد المتحدثين مع [S1] / [S2] تحولات والإشارات غير اللفظية. اختار بارك للرواية العاطفية وصوت الشخصيات ، وديا للمحادثات ذهابا وإيابا. كلاهما متوفر على TextToSpeechAI.

Bark فريد في قدرته على توليد حديث تعبيري حقيقي مع المشاعر والأصوات غير اللفظية. وهو أبطأ من محركات أخرى ولكنه ينتج نتائج أكثر شبهاً بالإنسان للمحتوى الإبداعي. للتخليق الأسرع، استخدم Piper. للاستنساخ الصوتي، استخدم F5-TTS أو OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try القشرة Now

Generate your first audio free. No credit card required.

Start Free