أنا
Ultraتحويل النصوص إلى صوت موجه نحو الحوار مع استنساخ الصوت والأصوات غير اللفظية
عن أنا
ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from
السمات الرئيسية
جيل الحوار
توليد محادثات طبيعية متعددة المتحدثين بأصوات متميزة وتناوب.
الأصوات غير اللفظية
تضاف عبارة [ضحك]، [انتفاخ]، [سعال]، (تنفس) للتعبير الطبيعي عن التعبيرات الشبه اللغوية.
استنساخ الصوت
استنساخ أي صوت من 5-10 ثوان من السمع المرجعي للكلام الشخصي.
محادثة طبيعية
1.6B البارامترات تنتج لغة طبيعية جدا ونغمة المحادثة.
حالات الاستخدام
كيف تستخدم أنا
-
1
انضم مجانا أو افتح العرض
إنشاء حساب مجاني TextToSpeechAI للمطالبة ببدء الائتمانات، أو فتح العرض التجريبي بدون التسجيل لتجربة حوار ديا على الفور.
-
2
انتقِ محرك Dia
في لوحة التحكم لترجمة النصوص إلى صوت، اختر Dia من قائمة المحركات. Dia هو نموذج ذو طبقة فائقة موجه نحو الحوار مع دعم للمتحدثين المتعددين واستنساخ الصوت.
-
3
كتابة نص حوار مع علامات
ضع محادثتك باستخدام [S1] و [S2] لتحديد كل دور للمتحدث، وأسقط علامات غير لفظية مثل [ضحك]، [انتفاخ]، [سعال]، أو (تنفس) حيث تريد ردود فعل طبيعية.
-
4
صنع الصوت
انقر على إنشاء لإرسال نص ديّا الخاص بك إلى وحدات المعالجة الرسومية المستضافة لدينا. وسيقوم ديّا بعرض حوار المتكلمين مع التناوب وعلاماتك غير اللفظية في ملف صوت واحد.
-
5
تنزيل أو استدعاء واجهة البرمجة التطبيقية
تحميل الحوار المنتهي في الشكل الذي اخترته، أو أتمتته بنشر نفس النص [S1]/[S2] إلى TextToSpeechAI API مع رمز حسابك.
أنا ألف - البرنامج المتقدم للتطبيق
توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "مرحباً كيف حالك اليوم؟ أنا بخير، شكراً على السؤال",
"voice": "en_US-lessac-medium"
}'
الأسئلة المتكررة
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50