در مورد F5- TTS
ability. It is a
ویژگیهای کلیدی
تولید سریع
معماری غیر خودبازگشتی برای سنتز سریع گفتار.
شبیهسازی Zero-Shot
هر صدایی را از یک نمونه کوتاه صدا بدون تنظیم دقیق کپی کنید.
صداقت بالا
تطبیق جریان تولید خروجی گفتار طبیعی و با کیفیت بالا را فراهم میکند.
روانی طبیعی
نظم و ترتیب طبیعی و نظم و ترتیب تصادفی.
چندزبانه
این زبان با زبانهای گوناگون همخوانی دارد.
متن باز
این نرمافزار برای استفاده تجاری رایگان است.
موارد استفاده
چطور استفاده شود F5- TTS
-
1
ثبت نام رایگان یا باز کردن نمایش
Create a free TextToSpeechAI account to receive starter credits, or jump straight into the free demo to try F5-TTS with no payment required.
-
2
انتخاب F5- TTS و (اختياری) بارگذاری یک ویدئو مرجع
F5-TTS را به عنوان موتور خود انتخاب کنید. برای شبیهسازی یک صدا ، یک نمونه مرجع کوتاه ۱۰-۳۰ ثانیهای از بلندگو هدف را بارگذاری کنید ، تا F5-TTS بتواند صدا و لهجه آنها را ضبط کند. برای استفاده از صدای F5-TTS داخلی ، این گام را ترک کنید.
-
3
وارد کردن متن
متنی را که میخواهید خوانده شود تایپ یا بچسبانید. F5-TTS آن را به صورت طبیعی با صدای انتخاب شده یا شبیه سازی شده شما با صدای نرم در زبانهای پشتیبانی شده متعدد میخواند.
-
4
تولید گفتار
کلیک کنید و F5-TTS به سرعت صدای شما را در زیرساخت GPU ما ترکیب میکند، با نرخ پریمیوم ۲۵ کرون در هر ۱۰۰۰ کاراکتر.
-
5
دانلود یا استفاده از API
فایل صوتی نهایی را به صورت MP3، WAV یا OGG دانلود کنید، یا API TextToSpeechAI را با شناسه صوتی F5-TTS خود فراخوانی کنید تا تولید را در برنامههای خود خودکار کنید.
F5- TTS API
تولید گفتار به صورت برنامهریزی شده با استفاده از REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "F5\u002DTTS، گفتار سریع و روان را با قابلیتهای شبیهسازی صدای شگفتانگیز ارائه میدهد.",
"voice": "en_US-lessac-medium"
}'
پرسشهای متداول
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 3-4GB
- Credits/1000 chars 25