صدای دلنشین ۲Name
Premiumشبیهسازی صدای چندزبانه Zero-shot با پشتیبانی جریان
در مورد صدای دلنشین ۲Name
CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.
ویژگیهای کلیدی
شبیهسازی صدای Zero-Shot
هر صدایی را از ۳ تا ۱۰ ثانیه صدای مرجع با صدایی با کیفیت بالا کپی کنید.
چندزبانه
از زبان چینی، انگلیسی، ژاپنی، کرهای و کانتونی با ترکیب بین زبانی پشتیبانی میکند.
پشتیبانی جریان
حالت جریان با تأخیر کم برای برنامههای کاربردی زمان واقعی و سیستمهای تعاملی.
نظم طبیعی
مدلسازی پیشرفتهٔ صدای گفتار، صدای طبیعی را با نتبندی مناسب تولید میکند.
موارد استفاده
چطور استفاده شود صدای دلنشین ۲Name
-
1
ثبت نام و درخواست اعتبار رایگان
Create a free TextToSpeechAI account to claim your starter credits, or try the demo first. No GPU or local CosyVoice2 install is needed - everything runs on our infrastructure.
-
2
انتخاب صدای دلنشین ۲ و اضافه کردن یک کلیپ مرجع
CosyVoice2 را به عنوان موتور خود انتخاب کنید ، سپس یک ضبط مرجع ۳- ۱۰ ثانیهای از صدایی که میخواهید شبیه سازی کنید را بارگذاری کنید. CosyVoice2 ویژگیهای سخنران را برای شبیه سازی چندزبانه با شلیک صفر استخراج میکند.
-
3
متن خود را در هر زبان پشتیبانیشده وارد کنید
تایپ یا چسباندن دستنوشتۀ خود به زبان چینی، انگلیسی، ژاپنی، کرهای یا کانتونی. CosyVoice2 از ترکیب زبانی پشتیبانی میکند ، بنابراین صدای شبیهسازی شده میتواند به زبانی متفاوت از ویدئو مرجع صحبت کند.
-
4
تولید گفتار
کلیک روی Generate و CosyVoice2 گفتار طبیعی و چندزبانه را در صدای شبیه سازی شده ترکیب میکند، معمولاً در عرض چند ثانیه برای متن کوتاه.
-
5
دانلود یا استفاده از API
فایل صوتی نهایی را به صورت MP3 یا WAV از تاریخچه خود دانلود کنید، یا از طریق REST API TextToSpeechAI، کپی صدای CosyVoice2 را در مقیاس خودکار کنید.
صدای دلنشین ۲Name API
تولید گفتار به صورت برنامهریزی شده با استفاده از REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2، گفتار طبیعی چندزبانه را با قابلیت شبیهسازی صدای صفر\u002Dشلیک ارائه میدهد.",
"voice": "en_US-lessac-medium"
}'
پرسشهای متداول
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25