أوبن فويس
Ultraاستنساخ الصوت الفوري مع التحكم في الصوت الحبيبي
عن أوبن فويس
of the voice and apply it to the speaking style. OpenVoice is a versatile instant voice cloning model that allows fine-grained control over speaking style, allowing you to take a look at the voice and apply it to the speaking style. OpenVoice
السمات الرئيسية
الاستنساخ الفوري
استنساخ أي صوت من مجرد بضعة ثوان من الصوت.
التحكم في الصوت
تطبيق نغمات فرحة، حزن، غضب، متحمس، أو همس.
نقل الأسلوب
فصل الهوية الصوتية عن أسلوب الكلام من أجل المرونة.
اللغات المتعددة
استخدام الأصوات المستنسخة عبر اللغات المختلفة.
التجهيز السريع
الاستدلال الفعال لتوليد الصوت بسرعة.
المصدر المفتوح
معهد ماساتشوستس للتكنولوجيا مرخص للتطبيقات التجارية.
حالات الاستخدام
كيف تستخدم أوبن فويس
-
1
تسجيل مجاني أو تجربة العرض
إنشاء حساب مجاني TextToSpeechAI للحصول على ائتمانات البدء، أو استخدام العرض على الصفحة للاستماع إلى OpenVoice قبل التعهد. لا GPU محلية أو التثبيت مطلوب - كل شيء يعمل على خواديمنا.
-
2
اختار OpenVoice وتحميل مقطع مرجعي
انقر على محرك OpenVoice ثم قم بتحميل بضعة ثوان من الصوت المرجعي النظيف لنسخ الصوت المستهدف على الفور. وتسجل OpenVoice هوية المتكلم حتى تتمكن من إعادة استخدامه عبر أي نص أو نغمة.
-
3
أدخل نصك
يكتب أو يصطف النص الذي تريد أن يقال في الصوت المستنسخ. OpenVoice يدعم حوالي 10 لغات وتسليم متعدد اللغات، لذلك يمكنك الكتابة بلغة مختلفة عن المقطع المرجعي.
-
4
اختار أسلوب نغمة و تولد
ان اختيار واحد من تسعة اساليب صوت اوبن فويس - افتراضي، وودي، ومشوق، ومثير، وحزين، وغضب، ومرعب، وصرخة، وهمس - ثم توليد نفس الصوت المستنسخ سوف يتكلم مع ذلك التسليم العاطفي.
-
5
تنزيل أو استخدام واجهة البرمجة التطبيقية
تحميل الصوت الخاص بك في MP3، WAV، أو OGG، أو توليد آلي من خلال TextToSpeechAI API عن طريق نقل الصوت المستنسخ وأنماط النغمة في كل طلب.
أوبن فويس ألف - البرنامج المتقدم للتطبيق
توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "يمكن أن يتحدث OpenVoice بأي نغمة \u002D سعيد، حزين، أو حتى يهمس.",
"voice": "en_US-lessac-medium"
}'
الأسئلة المتكررة
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50