F5-TTS

Premium

جلدی، فائل اور کلونینگ کے ساتھ وفادار متن سے بولنے

Fast رفتار
Very Good معيار
ہاں کلوننگ
5 زبانیں

متعلقہ F5-TTS

ability. F5-TTS is a non-autoregressive text-to-speech model that achieves fast inference while maintaining excellent fidelity to reference voices. Using flow matching techniques, it generates natural speech with excellent accuracy and fidelity to reference voices. F5-TTS is a non-autoregressive text-to-speech model that achieves fast inference while maintaining excellent

کلیدی خصوصیات

جلدی پیدائش

تیز آواز سنتز کے لیے غیر خودکار واپسی فن تعمیر.

صفر-شٹ کلوننگ

کوئی آواز کو ایک مختصر آڈیو نمونے سے بلا Fine-Tuning کلون کریں.

اعلیٰ وفادار

فلو میچنگ قدرتی، اعلیٰ معیاری بولنے کا نتیجہ پیدا کرتا ہے۔

فطري شفافيت

تمام پر نرم prosody اور قدرتی ریتمی.

چند زبانوں والا

قدرتی تلفظ کے ساتھ متعدد زبانوں کی حمایت.

اوپن سورس

ایم آئی ٹی نے مکمل تجارتی استعمال کے لئے لائسنس دی ہے۔

استعمال کے حالات

مواد کی تخلیق ویڈیو ڈبلنگ آڈیو بک پروڈیوس پوڈکاسٹ پیدائش ذاتی مددگار ریل ٹائم ایپلیکیشنز

استعمال کيونکر کريں F5-TTS

  1. 1

    مفت میں رجسٹر کریں یا ڈیمو کھولیں

    شروع کریڈٹ حاصل کرنے کے لیے مفت TextToSpeechAI اکاؤنٹ بناؤ، یا F5-TTS کو آزمانے کے لیے مفت ڈیمو میں براہ راست جاؤ، کوئی ادائیگی کی ضرورت نہیں ہے۔

  2. 2

    F5-TTS منتخب کريں اور (اختياري) ريفرنس کلپ اپ لوڈ کريں

    آپ کا انجن F5-TTS منتخب کريں آواز کو کلون کر نے کے ليے ، مقصدي اسپيکر کا مختصر 10-30 سيکنڈ ريفرنس نمونہ اپ لوڈ کريں تا کہ F5-TTS انکے تنا اور اکسن Zero-shot کو پکڑ سکے ، اس قدم کو چھوڑ کر اندروني F5-TTS آواز استعمال کريں

  3. 3

    آپ کا متن داخل کریں

    ٹائپ يا پيسٹ کريں متن جو آپ بولنا چا هيتے هيں F5-TTS اس کو آپکے منتخب يا کلون آواز ميں فطري طور پر پڑھتا هے ، با ڑي زبانوں ميں آسان پرو زودي کے ساتھ

  4. 4

    زبان بنا ئيں

    کلیک جنیئر اور F5-TTS آپ کی اوڈیو جلدی سے ہمارے GPU بنیادی ڈھانچے پر synthesizes، 25 کریڈٹ پر 1000 حروف پر پریمیئم شرح پر بلنگ.

  5. 5

    API ڈائون لوڈ کریں یا استعمال کریں

    MP3, WAV, or OGG کے طور پر ختم شدہ آڈیو ڈائون لوڈ کریں، یا آپ کے اپنے ایپلیکیشنوں میں خودکار پیداوار کے لئے آپ کے F5-TTS وائٹ ID کے ساتھ TextToSpeechAI API کو بلائیں.

F5-TTS API

TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "F5\u002DTTS تیز، زبانی بات چیت کے ساتھ اثر انداز آواز کلوننگ صلاحیتوں کے ساتھ فراہم کرتا ہے.",
    "voice": "en_US-lessac-medium"
  }'

بار بار پوچھے گئے سوالات

F5-TTS (فسٹ ، فلوئنٹ ، فائڈل TTS) جديد متن سے کلام ماڈل هے جو موثر ، اعلا معيار کلام سنتھز کے ليے فلو ميچنگ استعمال کر تا هے یہ صفر شوٹ ويز کلونينگ کو مدد ديتا هے اور روايتي خود رجعي ماڈل سے جلدي طبعي کلام پيدا کر تا هے TextToSpeechAI پر F5-TTS ويز کلونينگ کے ليے استعمال کيا جا نے والا ديفا لوٹ انجن هے

F5-TTS آواز صفر شوٹ کي کلون کر تا هے ، کوئي تربيت ضروري نهيں هے : آپ تيرجس اسپيکر کا مختصر ريفرنس ريکا رڈ اپ لوڈ کريں اور ماڈل انکے آواز کي خاصيتوں کو فوري طور پر نکال تا هے پھر اس کلون آواز ميں کوئي متن کي سنتز کر تا هے ، نمونے سے تنا ن ، اکشن اور پرو زودي کي قبضه کر تا هے

F5-TTS صاف بولنے کے تقریباً 10 سے 30 سیکنڈ کے مختصر حوالہ کلیپ سے آواز کو کلون کر سکتا ہے. ایک صاف، شور سے آزاد ریکارڈ سب سے زیادہ وفادار نتائج پیدا کرتا ہے، اور آپ کو تربیت کے اعدادوشمار کے گھنٹوں کی ضرورت نہیں ہے جیسے پرانی کلوننگ سسٹم کرتے تھے.

ہاں F5-TTS کوڈ MIT لائسنس ہے اور TextToSpeechAI کو OpenF5-TTS-Base وزن چلتا ہے جو تجارتي طور پر Apache 2.0 لائسنس کے تحت جاري کريے جا رہے هے ۔ اس اتحاد کے باعث F5-TTS تجارتي مصنوعات ميں استعمال کر نے کے ليے محفوظ هے ، اگر آپ کو اس آواز کے حق هے جو آپ کلون کريں هيں

ہاں F5-TTS ایک غیر خودکار واپسی فلوس میچنگ آرکیٹیکٹچر استعمال کرتا ہے ، اس لئے یہ بارک یا ٹکوٹوز جیسے خودکار واپسی ماڈلز سے زیادہ تیزی سے بولتا ہے یہ اسے واقعی وقت اور اعلی حجم کے کام کے لوڈ کے لئے مناسب بناتا ہے جب بھی وہ قدرتی آواز بناتا ہے

F5-TTS قدرتی prosody کے ساتھ اعلیٰ کیفیت کی اوڈيو پیدا کرتا ہے، نرم ریتمی، اور واضح articulation. یہ کیفیت اور رفتار کا بہترین توازن حاصل کرتا ہے، اس کو زیادہ تر مواد، راوی، اور کلوننگ استعمال کے حالات کے لیے ایک مضبوط ڈیفالٹ بناتا ہے.

F5-TTS VRAM پر تیز اور ہلکا ہے، جب آپ کو تیزی سے رونق یا بڑے بیٹس کی ضرورت ہوتی ہے تو اسے بہترین بناتا ہے، اور یہ TextToSpeechAI کا ڈیفالٹ کلوننگ انجن ہے۔ StyleTTS2 ایک الٹرا-ٹیئر انجن ہے جو F5-TTS کو خام وفاداری پر باہر نکال سکتا ہے، اس لئے StyleTTS2 کو منتخب کریں جب زیادہ سے زیادہ کیفیت تیزی اور قیمت سے زیادہ اہم ہے.

F5-TTS انگریزی، چینی اور دیگر زبانوں کو قدرتی آواز کے ساتھ مدد دیتا ہے یہ کراس زبانوں کے کلوننگ کو بھی ہینڈل کرتا ہے، آپ کو اصل حوالہ ریکارڈ سے مختلف زبان بولنے کے لیے ایک کلون کی آواز استعمال کرنے کی اجازت دیتا ہے.

F5-TTS میمورے کو موثر بناتا ہے، عام طور پر VRAM کے 4-6GB کی ضرورت ہوتی ہے. TextToSpeechAI پر تمام نسلیں ہمارے GPU بنیادی ڈھانچے پر چلتی ہیں، تو آپ کو اس کو استعمال کرنے کے لیے مقامی GPU کی ضرورت نہیں ہے۔

F5-TTS TextToSpeechAI پر پرائم ٹیئر انجن ہے، 25 کریڈٹ پر 1000 حروف میں بلنگ کیا جاتا ہے. نئے اکاؤنٹس مفت شروع کریڈٹ حاصل کرتے ہیں، تو آپ F5-TTS کو ٹیسٹ کر سکتے ہیں، آواز کلوننگ سمیت، زیادہ خریدنے سے پہلے.

ہاں آپ TextToSpeechAI پر مفت ديمو کے ذریعے F5-TTS کو آزمائي کر سکتے هيں ، اور مفت اڪاؤنٹ بنا کر شروع کر نے کے ليے کريڈٹ حاصل کر سکتے هيں ، اس ليے آپ بولي بنا سکتے هيں اور آواز کي کلون کر سکتے هيں آپ صرف اس وقت اپ گرڈ کر سکتے هيں جب آپ کو اور زیادہ حروف کي ضرورت هے

ہمارے لائبريري سے موجود F5-TTS آواز منتخب کريں يا ريفرنس آ ڊيو اپ لوڈ کر کے کلون آواز بنايں ، پھر آپ کے API درخواستوں ميں اس آواز ID کو منتقل کريں F5-TTS WAV ناتائي آ وٹ پٹ اور TextToSpeechAI MP3 ، WAV يا OGG خودکار تبديلي کے ساتھ واپس کر سکتا هے

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 3-4GB
  • Credits/1000 chars 25

Try F5-TTS Now

Generate your first audio free. No credit card required.

Start Free