سلحفاة TTS

Ultra

حديث عالي الجودة بطبيعة لا مثيل لها

Very Slow السرعة
Exceptional الجودة
نعم الاستنساخ
1 اللغات

عن سلحفاة TTS

s available. Tortoise TTS is a

السمات الرئيسية

الجودة العالية جدا

أكثر صوت طبيعي لـ TTS متوفر.

استنساخ الصوت

استنسخ الأصوات بأمانة وفوارق استثنائية

الصوت الطبيعي

يسجل أنماط الكلام الدقيقة والتعبيرات الدقيقة.

الجودة

اختار من ultra_fast إلى high_quality processing.

عمق عاطفي

ينتج حديثا مع صدى عاطفي حقيقي.

المصدر المفتوح

Apache 2.0 مرخص بحقوق الاستخدام التجاري.

حالات الاستخدام

الكتب السمعية العالية الجودة إنتاج الأفلام السرد الوثائقي صوتيات مهنية مشاريع المحفوظات المحتوى الرفيع المستوى

سلحفاة TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

كيف تستخدم سلحفاة TTS

  1. 1

    تسجيل أو تجربة العرض التجريبي المجاني

    إنشاء حساب مجاني TextToSpeechAI للحصول على ائتمانات البدء، أو استخدام عرض الصفحة الرئيسية لتجربة Tortoise دون التسجيل في. Tortoise هو محرك Ultra-tier (50 ائتمانات لكل 1000 رمز)، لذلك الائتمانات المجانية هي مثالية لاختبار قصير الأول.

  2. 2

    اختار Tortoise وإضافة صوت اختياري للاستنساخ

    انقر فوق صوت Tortoise من متصفح الصوت. لنسخ شخص معين، قم بتحميل مقطع مرجعي (من الأفضل عدة عينات نظيفة 5-10 ثانية) وسوف يقوم Tortoise بإعادة إنتاج ذلك الصوت بجودة عالية. وإلا اختر أحد أصوات Tortoise الداخلة.

  3. 3

    أدخل نصك

    كتابة أو لصق النص الذي تريد أن يقال. لأن Tortoise بطيء، ابدأ بمقطع قصير للتأكد من الصوت والنبرة قبل إرسال فصل كامل من الكتاب السمعي أو النص الطويل.

  4. 4

    اختار نوعية مسبقة التحديد وتولد

    اختار جودة Tortoise المحددة مسبقاً: ultra_fast للاختبارات السريعة، fast لتوازن سرعة/جودة جيد (الافتراضي الموصى به)، standard، أو high_quality لأقصى قدر من الواقعية. ثم انقر على توليد وكون صبوراً - يمكن أن يستغرق Tortoise من 30 ثانية إلى عدة دقائق لكل مقطع، خاصة عند الإعدادات المسبقة الأعلى.

  5. 5

    تنزيل أو استخدام واجهة البرمجة التطبيقية

    عندما ينتهي التوليد، قم بتنزيل الصوت بوصفه MP3، WAV، أو OGG، أو استرجعه من تاريخك. لتشغيل وظائف Tortoise آلياً، استدع API TextToSpeechAI ونقل الجودة المحددة مسبقاً التي اخترتها - تذكر السماح بفترات تأخير أطول لأن Tortoise يعرض ببطء.

سلحفاة TTS ألف - البرنامج المتقدم للتطبيق

توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "السلحفاة تستغرق وقتها، ولكن النتائج تستحق الانتظار.",
    "voice": "tortoise-angie"
  }'

الأسئلة المتكررة

نموذج Tortoise TTS هو نموذج ذاتي التراجع لتحويل النص إلى كلمة من صنع جيمس بيتكر، وهو يضع جودة الصوت فوق كل شيء آخر. وهو يجمع بين نمذجة اللغة القائمة على المحول وفك التشفير الانتشاري لتوليد كلمة ذات طبيعية لا مثيل لها، وعمق عاطفي، وصوتية شبيهة بالصوتية البشرية. ويُعتبر على نطاق واسع واحداً من أكثر محركات تحويل النص إلى كلمة واقعية ومفتوحة المصدر المتاحة.

نعم، لغة الترجمة التلقائية للطائرة هي لغة مفتوحة المصدر تحت ترخيص أباشي 2.0، الذي يسمح بالاستخدام التجاري، والتعديل، وإعادة التوزيع. على TextToSpeechAI، تقع لغة الترجمة التلقائية للطائرة في المستوى الأعلى عند 50 نقطة لكل 1000 كلمة بسبب متطلباتها الحسابية الثقيلة وجودتها الاستثنائية.

إن Tortoise بطيء بحكم تصميمه: فهو يولد العديد من المقاطع المرشحة بشكل تلقائي ومن ثم يصقل أفضلها بنموذج انتشار وخطوة إعادة ترتيب CLVP. وهذا الأنبوب الذي يركز على الجودة يعني أن مقطعاً واحداً يمكن أن يستغرق من 30 ثانية إلى عدة دقائق اعتماداً على طول النص والجودة المحددة مسبقاً. والمقايضات هي أن Tortoise ينتج بعض الكلام الأكثر طبيعية من أي محرك لتحويل النص إلى صوت.

يقدم Tortoise أربعة إعدادات مسبقة تقوم بمبادلة السرعة بالجودة: ultra_fast (أسرع بـ 10 مرات، جيد للاختبار)، fast (أسرع بـ 4 مرات، الافتراضية للإنتاج)، standard (متوازنة)، و high_quality (أقصى جودة، الأبطأ). وتقوم الإعدادات المسبقة الأعلى باختيار عينات أكثر من المرشحين وتشغيل المزيد من خطوات الانتشار قبل اختيار أفضل نتيجة. على TextToSpeechAI يمكنك اختيار إعداد مسبق قبل توليد.

نعم، يدعم برنامج Tortoise TTS استنساخ الصوت بأمانة استثنائية. توفر بضعة مقاطع مرجعية قصيرة من الصوت المستهدف (من الأمثل 3-10 عينات من 5-10 ثوان لكل منها)، ويسجل برنامج Tortoise نغمة المتحدث، ولهجة، وتيرة، وتعبيرات دقيقة. إنه أحد أكثر محركات الاستنساخ دقة، على الرغم من أن الاستنساخ يضيف إلى وقت التوليد الطويل بالفعل.

تم تدريب Tortoise في المقام الأول على مجموعات بيانات الكلام الإنجليزية، لذلك فإن اللغة الإنجليزية هي حيث تكون جودته أقوى. بالنسبة للمشاريع المتعددة اللغات التي تحتاج إلى واقعية مماثلة، فكر في F5-TTS أو CosyVoice2 على TextToSpeechAI، والتي تدعم المزيد من اللغات بينما لا تزال توفر استنساخ الصوت.

إن صوت السلاحف البحرية استثنائي، وغالباً ما لا يمكن تمييزه عن صوت الإنسان. فهو يسجل التنفس، والتردد، والنبرة، والصدى العاطفي الحقيقي الذي تفتقده النماذج الأخف وزناً. ولهذا السبب يظل مفضلاً في الكتب السمعية الفاخرة، وردود أفعال الأفلام، والعمل العالي الجودة في مجال الترجمة حيث يشكل الواقعية أهمية قصوى.

يتطلب Tortoise عادة 12-24 جيجا بايت من ذاكرة VRAM اعتمادا على الجودة المحددة مسبقا وحجم المجموعة، لذلك يوصى باستخدام وحدات معالجة رسومية عالية المستوى مثل RTX 3090، 4090، أو A100 للاستخدام المحلي. الاستدلال على وحدة المعالجة المركزية ممكن من الناحية التقنية ولكنه بطيئ للغاية. على TextToSpeechAI، يعمل النموذج على البنية التحتية لوحدة المعالجة المركزية الخاصة بنا، لذلك لا تحتاج إلى أي معدات خاصة بك.

من خلال TextToSpeechAI يمكنك أن تطلب MP3, WAV, or OGG, ونحن نقوم بتحويل الترميز مع الحفاظ على الجودة لذا يمكنك الحفاظ على تفاصيل النموذج الدقيقة في أي شكل يحتاجه مشروعك.

يقع تورتوز في مستوى التسعير العالي عند 50 نقطة لكل 1000 كلمة، مما يعكس وقت وحدة المعالجة المركزية الذي يستهلكه خط أنابيب الجودة الأولى. وتحصل الحسابات الجديدة على نقاط بدء مجانية، لذا يمكنك اختبار تورتوز قبل التعهد. ويغطي مستوى الأسعار العالي أيضاً StyleTTS2، وOpenVoice، وDia، وZonos.

كلاهما محركات من الطبقة العليا، ولكنهما يتاجران بشكل مختلف. Tortoise TTS يصل إلى القمة المطلقة من الطبيعة والعمق العاطفي ولكنه إلى حد كبير أبطأ المحرك. StyleTTS2 يقدم جودة قريبة من Tortoise مع توليد أسرع بكثير، مما يجعله الخيار الأفضل عندما تحتاج إلى العديد من المقاطع أو إعادة سريعة. اختار Tortoise عندما تكون الجودة غير قابلة للتفاوض والوقت ليس قيداً.

نعم. انضم إلى TextToSpeechAI لتلقي رصيد مبدئي مجاني، أو استخدم العرض على الصفحة الرئيسية، وانتخب صوت Tortoise لتوليد مقطع بدون تثبيت أي شيء. لأن Tortoise بطيء، ابدأ بجملة قصيرة و"سريع" مسبقاً لرؤية الجودة قبل تشغيل المهام الأطول.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try سلحفاة TTS Now

Generate your first audio free. No credit card required.

Start Free