صوت إلى نص

Premium

توليد صوت يوصف بالنص

Moderate السرعة
Very Good الجودة
لا الاستنساخ
1 اللغات

عن صوت إلى نص

voices based on the text descriptions you specify.

السمات الرئيسية

النصوص

توليد الأصوات من خلال وصف الخصائص المرغوبة.

السيطرة الإبداعية

حدد السن، ونوع الجنس، والنبرة، والسرعة، وأسلوب الكلام.

الأصوات الفريدة

إنشاء أصوات لا توجد في مكتبات قائمة مسبقاً.

الناتج الطبيعي

ينتج صوتاً طبيعياً عالي الجودة.

فعالة

الاستدلال السريع لتوليد الصوت الموصوف.

المصدر المفتوح

Apache 2.0 مرخص للاستخدام التجاري.

حالات الاستخدام

تصميم الصوت المشاريع الإبداعية نموذج أولي تطوير الألعاب الشخصيات إنشاء صوت مخصص

صوت إلى نص Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

كيف تستخدم صوت إلى نص

  1. 1

    تسجيل مجاني أو تجربة العرض

    إنشاء حساب مجاني TextToSpeechAI ل 200 ائتمانات البدء، أو فتح العرض التجريبي لتجربة Parler-TTS فورا دون التسجيل.

  2. 2

    انقر على Parler-TTS وكتب وصفاً صوتياً

    اختار بارلر-TTS كمحرك لك، ثم اكتب وصفاً صوتياً نصياً واضحاً مثل "تتحدث امرأة شابة بوضوح بلكنة أمريكية". ضع في الاعتبار السن، والجنس، واللغات، والسرعة، والمزاج لتكوين الصوت.

  3. 3

    أدخل النص الذي تريد التحدث عنه

    كتابة أو لصق النص الذي تريد أن يقال. Parler- TTS يقدم هذا النص في الصوت المحدد من قبل وصفك، لذلك إبقاء الوصف والنص في نفس اللغة (الإنجليزية تعمل أفضل).

  4. 4

    توليد الخطاب

    انقر على إنشاء لإرسال العمل إلى خلفية وحدة المعالجة الرسومية.

  5. 5

    تنزيل أو استدعاء واجهة البرمجة التطبيقية

    تحميل الصوت النهائي كMP3 أو WAV أو OGG، أو توليد آلي من خلال TextToSpeechAI API عن طريق نقل نصك وحفظ وصف الصوت في كل طلب.

صوت إلى نص ألف - البرنامج المتقدم للتطبيق

توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "فتاة شابّة هادئة تتحدث بلكنة أمريكيّة",
    "voice": "parler-female_american"
  }'

الأسئلة المتكررة

إن نموذج تحويل النص إلى كلمة (Parler-TTS) يعمل على توليد الأصوات من الأوصاف النصية. فبدلاً من اختيار أصوات مصنوعة مسبقاً، تصف ما تريده: "امرأة هادئة وناضجة ذات لهجة أسترالية تتكلم بوتيرة معتدلة".

على TextToSpeechAI، نحن نحصل على 25 نقطة لكل 1000 حرف (المستوى الأعلى) لقدراتها الفريدة في توليد الصوت.

يدعم Parler-TTS اللغة الإنجليزية في المقام الأول، وتعمل الأوصاف الصوتية بشكل أفضل باللغة الإنجليزية، على الرغم من أن النموذج يمكنه معالجة لهجات إنجليزية مختلفة (أمريكية، بريطانية، أسترالية، إلخ).

وصف خصائص الصوت بشكل طبيعي: "تتحدث امرأة شابة بوضوح بلكنة بريطانية" أو "يتحدث رجل مسن ذو صوت عميق ببطء وعناية". تضمن السن، والجنس، والنبرة، والسرعة، والمزاج.

Parler-TTS لديها سرعة توليد معتدلة، عادة 2-5 ثوان للجملة على وحدة المعالجة المركزية. تجهيز الوصف الصوتي يضيف الحد الأدنى من التكاليف العامة مقارنة بتوليد الكلام الفعلي.

لا، Parler-TTS يولد الأصوات من الأوصاف بدلا من استنساخ الأصوات الموجودة. لاستنساخ الصوت، استخدم StyleTTS2، F5-TTS، OpenVoice، أو Tortoise.

يحتاج Parler-TTS إلى 4-8 جيجابايت من ذاكرة العرض التفاعلي حسب حجم النموذج. تعمل النسخة المصغرة بذاكرة 4 جيجابايت، بينما يستفيد النموذج الكامل من 8 جيجابايت للأداء الأمثل.

نعم، Parler-TTS مرخصة من قبل Apache 2.0 وتدعم الاستخدام التجاري.بما أن الأصوات يتم توليدها من الأوصاف، فلا توجد شواغل بشأن ملكية الصوت.

تضمن وصفك الصوتي في طلب API مع نصك. API لدينا معالجة الوصف وتوليد الكلام المطابق. يمكنك حفظ الأوصاف المفضلة لإعادة الاستخدام.

ينتج برنامج Parler-TTS صوتاً جيداً جداً، وذو صوت طبيعي مع نغمة تتوافق مع صوتك الموصوف. وهو يخرج صوتاً بـ WAV بشكل أصلي، وعلى TextToSpeechAI يمكنك تحميله بـ MP3، أو WAV، أو OGG مع التحويل الآلي.

إن كلاً منهما محرك تعبيري مفتوح المصدر، ولكنهما يختلفان في التحكم. فالبرنامج الذي يقوم بترجمة النص إلى صوت (بارلر-TTS) يسمح لك بتوجيه الصوت من خلال وصف نصي بسيط (العمر، والنبرة، والإيقاع، والمزاج)، في حين يقوم برنامج بارك بإضافة إشارات غير لفظية مثل [الضحك] والموسيقى. واختار برنامج بارلر-TTS عندما تريد صوتاً محدداً موصوفاً، وبرنامج بارك عندما تريد تسليماً عاطفياً عفوياً.

نعم، يمكنك التسجيل لحساب مجاني على TextToSpeechAI للحصول على 200 نقطة بداية، أو استخدام العرض التجريبي للاستماع إلى Parler-TTS دون حساب، وهذا يكفي لاختبار العديد من الوصف الصوتي قبل اختيار حزمة من النقاط.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try صوت إلى نص Now

Generate your first audio free. No credit card required.

Start Free