أوبن فويس

Ultra

استنساخ الصوت الفوري مع التحكم في الصوت الحبيبي

Moderate السرعة
Very Good الجودة
نعم الاستنساخ
10 اللغات

عن أوبن فويس

of the voice and apply it to the speaking style. OpenVoice is a versatile instant voice cloning model that allows fine-grained control over speaking style, allowing you to take a look at the voice and apply it to the speaking style. OpenVoice

السمات الرئيسية

الاستنساخ الفوري

استنساخ أي صوت من مجرد بضعة ثوان من الصوت.

التحكم في الصوت

تطبيق نغمات فرحة، حزن، غضب، متحمس، أو همس.

نقل الأسلوب

فصل الهوية الصوتية عن أسلوب الكلام من أجل المرونة.

اللغات المتعددة

استخدام الأصوات المستنسخة عبر اللغات المختلفة.

التجهيز السريع

الاستدلال الفعال لتوليد الصوت بسرعة.

المصدر المفتوح

معهد ماساتشوستس للتكنولوجيا مرخص للتطبيقات التجارية.

حالات الاستخدام

المحتوى العاطفي رسوم متحركة ألعاب تفاعلية سرد الكتب السمعية أشرطة الفيديو التسويقية المساعدون الافتراضيون

كيف تستخدم أوبن فويس

  1. 1

    تسجيل مجاني أو تجربة العرض

    إنشاء حساب مجاني TextToSpeechAI للحصول على ائتمانات البدء، أو استخدام العرض على الصفحة للاستماع إلى OpenVoice قبل التعهد. لا GPU محلية أو التثبيت مطلوب - كل شيء يعمل على خواديمنا.

  2. 2

    اختار OpenVoice وتحميل مقطع مرجعي

    انقر على محرك OpenVoice ثم قم بتحميل بضعة ثوان من الصوت المرجعي النظيف لنسخ الصوت المستهدف على الفور. وتسجل OpenVoice هوية المتكلم حتى تتمكن من إعادة استخدامه عبر أي نص أو نغمة.

  3. 3

    أدخل نصك

    يكتب أو يصطف النص الذي تريد أن يقال في الصوت المستنسخ. OpenVoice يدعم حوالي 10 لغات وتسليم متعدد اللغات، لذلك يمكنك الكتابة بلغة مختلفة عن المقطع المرجعي.

  4. 4

    اختار أسلوب نغمة و تولد

    ان اختيار واحد من تسعة اساليب صوت اوبن فويس - افتراضي، وودي، ومشوق، ومثير، وحزين، وغضب، ومرعب، وصرخة، وهمس - ثم توليد نفس الصوت المستنسخ سوف يتكلم مع ذلك التسليم العاطفي.

  5. 5

    تنزيل أو استخدام واجهة البرمجة التطبيقية

    تحميل الصوت الخاص بك في MP3، WAV، أو OGG، أو توليد آلي من خلال TextToSpeechAI API عن طريق نقل الصوت المستنسخ وأنماط النغمة في كل طلب.

أوبن فويس ألف - البرنامج المتقدم للتطبيق

توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "يمكن أن يتحدث OpenVoice بأي نغمة \u002D سعيد، حزين، أو حتى يهمس.",
    "voice": "en_US-lessac-medium"
  }'

الأسئلة المتكررة

OpenVoice هو نموذج متقدم لتحويل النص إلى كلمة واستنساخ الصوت يفصل بشكل فريد الهوية الصوتية عن أسلوب الكلام. وهذا يسمح لك باستنساخ صوت ثم تطبيق نغمات عاطفية مختلفة دون الحاجة إلى مرجع صوتي جديد لكل مشاعر. وهو مصمم لتوليد كلمة تعبيرية قابلة للتحكم.

نعم، تقوم أوبن فويس بعملية استنساخ فوري للصوت من مجرد بضعة ثوانٍ من الصوت المرجعي - لا يلزم أي تدريب. بمجرد التقاط الصوت، يمكن لأوبن فويس إعادة استخدام تلك الهوية عبر أي نص وأي أسلوب صوت تختارونه.

يستخدم OpenVoice بنية من مرحلتين تفصل تركيب الكلام الأساسي عن تحويل الصوت. وبعد استنساخ الصوت، يمكنك تطبيق أي من 9 أنماط صوتية - افتراضية، ودية، وحيوية، ومثيرة، وحزينة، وغاضبة، ومروعة، وصاخبة، أو مهمسة - ونفس الصوت المستنسخ يتكلم بشكل مختلف استناداً إلى الصوت الذي اخترته دون إعادة التسجيل.

يدعم أوبن فويس تسعة أنماط من الكلام: الافتراضي، والودود، والسعيد، والمتحمس، والحزين، والغاضب، والمخيف، والصرخة، والهمس. ويعيد كل نمط تشكيل التسليم العاطفي في حين يحافظ على هوية المتحدث المستنسخة، مما يعطيك تحكماً دقيقاً في كيفية قراءة السطر.

إن برنامج أوبن فويس مفتوح المصدر بموجب رخصة معهد ماساتشوستس للتكنولوجيا، لذا فهو مجاني للاستخدام التجاري. وكما هي الحال مع أي نموذج استنساخ، فتأكد من امتلاكك للحقوق المناسبة لأي صوت تستنسخه لأغراض المشاريع التجارية.

يدعم برنامج أوبن فويس حوالي عشر لغات، بما في ذلك الإنجليزية، والصينية، واليابانية، والكورية، والعديد من اللغات الأوروبية. كما يقدم الاستنساخ عبر اللغات، بحيث يمكنك استنساخ صوت بلغة واحدة وجعله يتكلم بلغة أخرى بشكل طبيعي.

إن سرعة توليد صوت أوبن فويس معتدلة، حيث يقوم عادة بتمثيل جملة في 2-4 ثوان على وحدة معالجة رسومية. وجودة المخرج جيدة للغاية، مع إعادة إنتاج الصوت الواضح ونقل النغمة الذي يحافظ على هوية المتحدث سليمة في حين يغير بشكل مقنع التسليم العاطفي.

يتطلب OpenVoice عادة 6-8 جيجا بايت من ذاكرة VRAM اعتمادا على حجم الدفعة وحمل تحويل الصوت. وهو يعمل بشكل مريح على النطاق المتوسط إلى النطاق المتوسط الأعلى من وحدات المعالجة الرسومية، وعلى TextToSpeechAI يتم التعامل مع كل هذا على خواديم لذا لا تحتاج إلى أي معدات محلية.

إن أوبن فويس هو محرك من الطبقة العليا، وسعره 50 نقطة لكل 1000 حرف. ويعكس هذا المستوى التحكم المتقدم في الصوت والحساب الإضافي اللازم للاستنساخ بالإضافة إلى أنابيب تحويل الأسلوب.

إن OpenVoice فريد من نوعه من حيث التحكم في النبرة والأسلوب: يمكنك أخذ صوت مستنسخ وإعادة تقديمه على أنه سعيد، أو حزين، أو غاضب، أو مهمس. و F5-TTS أسرع، وهو محرك الاستنساخ الافتراضي لدينا للكلام الطبيعي والمحايد. اختار OpenVoice عندما تحتاج إلى التحكم في الأسلوب العاطفي، و F5-TTS عندما تريد أسرع نسخة طبيعية.

إنشاء صوت مستنسخ من خلال تحميل مرجع الصوت، ثم تحديد نمط نغمة في طلب API الخاص بك. API تطبق نغمة عاطفية المختارة على الصوت المستنسخ تلقائيا ويعود الصوت في MP3، أو WAV، أو OGG.

نعم. تسجيل لحساب TextToSpeechAI مجانا لتلقي ائتمانات البدء وتجريب OpenVoice استنساخ والتحكم في الصوت، أو استخدام على الصفحة عرض أولا. لا يوجد تركيب محلي - تحميل مقطع مرجعي، واختيار صوت، وإنشاء في المتصفح.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try أوبن فويس Now

Generate your first audio free. No credit card required.

Start Free