GPT-SOVITS
Premiumشبیهسازی صدا با چند شلیک با بالاترین کیفیت خروجی
در مورد GPT-SOVITS
GPT-SoVITS combines GPT-style language modeling with SoVITS voice conversion to achieve state-of-the-art few-shot voice cloning. With just 3-10 seconds of reference audio plus a transcript, it produces remarkably natural speech that closely matches the target voice. It excels at cross-lingual synthesis - train on one language and generate in another.
ویژگیهای کلیدی
شبیهسازی صدای چند شلیک
هر صدایی را از ۳ تا ۱۰ ثانیه صدای مرجع با رونوشت برای بهترین کیفیت کپی کنید.
ترکیب زبانی
این زبان در کنار زبان چینی، زبان انگلیسی، ژاپنی، کرهای و کانتونی نیز صحبت میشود.
بالاترین کیفیت
GPT-SoVITS بهطور مداوم در میان بهترین مدلهای شبیهسازی صدای موجود قرار دارد.
متن باز
این کتاب دارای مجوز کامل MIT با توسعه فعال جامعه و مستندات گسترده است.
موارد استفاده
چطور استفاده شود GPT-SOVITS
-
1
ایجاد حساب رایگان یا باز کردن حساب آزمایشی
Sign up for TextToSpeechAI to receive free starter credits, or jump straight into the demo to try GPT-SoVITS with no signup required.
-
2
GPT-SoVITS را انتخاب کنید و یک کلیپ مرجع را بارگذاری کنید
GPT-SoVITS را به عنوان موتور خود انتخاب کنید ، سپس یک کلیپ مرجع ۳-۱۰ ثانیهای از صدایی که میخواهید شبیه سازی کنید را بارگذاری کنید. اضافه کردن رونوشت آن کلیپ ، تمیزترین و دقیقترین شبیه سازی را میدهد.
-
3
وارد کردن متن
متنی را که میخواهید در صدای شبیهسازی شده خوانده شود تایپ یا بچسبانید. GPT-SoVITS از چینی، انگلیسی، ژاپنی، کرهای و کانتون پشتیبانی میکند، از جمله شبیهسازی بین زبانی از یک مرجع در زبان دیگر.
-
4
تولید صدا
برای ارسال کار به سرورهای GPU ما روی تولید کلیک کنید. GPT-SoVITS با سرعت متوسط، با کیفیت عالی، سخنرانی شبیه سازی شده را با ۲۵ کرید برای هر ۱۰۰۰ کاراکتر ارائه میکند.
-
5
دانلود یا استفاده از API
فایل صوتیتان را به عنوان یک فایل GPT-SoVITS دانلود کنید، یا تولید خودکار را از طریق REST API TextToSpeechAI در api.texttospeechai.com برای جریانهای کاری تولید انجام دهید.
GPT-SOVITS API
تولید گفتار به صورت برنامهریزی شده با استفاده از REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS تولید بالاترین کیفیت شبیهسازی صدا از تنها چند ثانیه از صدا.",
"voice": "en_US-lessac-medium"
}'
پرسشهای متداول
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25