صوت رائع
Premiumاستنساخ صوتي متعدد اللغات بدون تسجيل مع دعم التدفق
عن صوت رائع
CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.
السمات الرئيسية
استنساخ الصوت
استنساخ أي صوت من 3-10 ثوان من السمع المرجعي مع دقة عالية.
تعدد اللغات
يدعم الصينية والإنكليزية واليابانية والكورية والكانتونية مع توليف متعدد اللغات.
دعم البث
)ب( طريقة تدفق منخفضة التأخير للتطبيقات الزمنية الحقيقية والنظم التفاعلية.
الصوت الطبيعي
وينتج نمذجة النطق المتقدمة كلمات ذات صوت طبيعي مع النطق المناسب.
حالات الاستخدام
كيف تستخدم صوت رائع
-
1
انضم واحصل على ائتمانات مجانية
إنشاء حساب TextToSpeechAI مجانا للمطالبة ببدء الائتمانات، أو تجربة العرض الأول. لا GPU أو CosyVoice2 محلية تثبيت مطلوب - كل شيء يعمل على البنية التحتية لدينا.
-
2
انقر على CosyVoice2 و أضف مقطع مرجعي
اختار CosyVoice2 كمحركك، ثم قم بتحميل تسجيل مرجعي نظيف مدته 3-10 ثوانٍ للصوت الذي تريد استنساخه. سوف يستخرج CosyVoice2 خصائص المتحدث لاستنساخ متعدد اللغات من الصفر.
-
3
أدخل نصك بأي لغة مدعومة
يكتب أو يصطف النص بالصينية أو الإنجليزية أو اليابانية أو الكورية أو الكانتوني. ويدعم CosyVoice2 التركيب عبر اللغات، بحيث يمكن للصوت المستنسخ أن يتكلم لغة مختلفة عن المقطع المرجعي.
-
4
توليد الخطاب
ويتم توليف الكلام الطبيعي المتعدد اللغات في الصوت المستنسخ، عادة في غضون ثوانٍ للنص القصير، باستخدام برنامج CosyVoice2.
-
5
تنزيل أو استخدام واجهة البرمجة التطبيقية
تنزيل الصوت النهائي كMP3 أو WAV من تاريخك، أو أتمتة CosyVoice2 استنساخ الصوت على نطاق واسع من خلال REST API TextToSpeechAI.
صوت رائع ألف - البرنامج المتقدم للتطبيق
توليد الكلام برمجياً باستخدام REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "وتوفر برامجية CosyVoice2 صوتاً طبيعياً متعدد اللغات مع القدرة على استنساخ الصوت دون أي تشويش.",
"voice": "en_US-lessac-medium"
}'
الأسئلة المتكررة
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25