F5-TTS
Premiumجلدی، فائل اور کلونینگ کے ساتھ وفادار متن سے بولنے
متعلقہ F5-TTS
ability. F5-TTS is a non-autoregressive text-to-speech model that achieves fast inference while maintaining excellent fidelity to reference voices. Using flow matching techniques, it generates natural speech with excellent accuracy and fidelity to reference voices. F5-TTS is a non-autoregressive text-to-speech model that achieves fast inference while maintaining excellent
کلیدی خصوصیات
جلدی پیدائش
تیز آواز سنتز کے لیے غیر خودکار واپسی فن تعمیر.
صفر-شٹ کلوننگ
کوئی آواز کو ایک مختصر آڈیو نمونے سے بلا Fine-Tuning کلون کریں.
اعلیٰ وفادار
فلو میچنگ قدرتی، اعلیٰ معیاری بولنے کا نتیجہ پیدا کرتا ہے۔
فطري شفافيت
تمام پر نرم prosody اور قدرتی ریتمی.
چند زبانوں والا
قدرتی تلفظ کے ساتھ متعدد زبانوں کی حمایت.
اوپن سورس
ایم آئی ٹی نے مکمل تجارتی استعمال کے لئے لائسنس دی ہے۔
استعمال کے حالات
استعمال کيونکر کريں F5-TTS
-
1
مفت میں رجسٹر کریں یا ڈیمو کھولیں
شروع کریڈٹ حاصل کرنے کے لیے مفت TextToSpeechAI اکاؤنٹ بناؤ، یا F5-TTS کو آزمانے کے لیے مفت ڈیمو میں براہ راست جاؤ، کوئی ادائیگی کی ضرورت نہیں ہے۔
-
2
F5-TTS منتخب کريں اور (اختياري) ريفرنس کلپ اپ لوڈ کريں
آپ کا انجن F5-TTS منتخب کريں آواز کو کلون کر نے کے ليے ، مقصدي اسپيکر کا مختصر 10-30 سيکنڈ ريفرنس نمونہ اپ لوڈ کريں تا کہ F5-TTS انکے تنا اور اکسن Zero-shot کو پکڑ سکے ، اس قدم کو چھوڑ کر اندروني F5-TTS آواز استعمال کريں
-
3
آپ کا متن داخل کریں
ٹائپ يا پيسٹ کريں متن جو آپ بولنا چا هيتے هيں F5-TTS اس کو آپکے منتخب يا کلون آواز ميں فطري طور پر پڑھتا هے ، با ڑي زبانوں ميں آسان پرو زودي کے ساتھ
-
4
زبان بنا ئيں
کلیک جنیئر اور F5-TTS آپ کی اوڈیو جلدی سے ہمارے GPU بنیادی ڈھانچے پر synthesizes، 25 کریڈٹ پر 1000 حروف پر پریمیئم شرح پر بلنگ.
-
5
API ڈائون لوڈ کریں یا استعمال کریں
MP3, WAV, or OGG کے طور پر ختم شدہ آڈیو ڈائون لوڈ کریں، یا آپ کے اپنے ایپلیکیشنوں میں خودکار پیداوار کے لئے آپ کے F5-TTS وائٹ ID کے ساتھ TextToSpeechAI API کو بلائیں.
F5-TTS API
TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "F5\u002DTTS تیز، زبانی بات چیت کے ساتھ اثر انداز آواز کلوننگ صلاحیتوں کے ساتھ فراہم کرتا ہے.",
"voice": "en_US-lessac-medium"
}'
بار بار پوچھے گئے سوالات
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 3-4GB
- Credits/1000 chars 25