কোসিভয়েস২Name
Premiumস্ট্রিমিং সমর্থনের সাথে জিরো-শট বহুভাষী শব্দ ক্লোনিং
পরিচিতি কোসিভয়েস২Name
CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.
প্রধান বৈশিষ্ট্য
Zero-Shot ভয়েস ক্লোনিং
উচ্চ নির্ভরযোগ্যতার সাথে রেফারেন্স অডিও থেকে ৩-১০ সেকেন্ডের যেকোন শব্দ ক্লোন করুন।
বহুভাষিক
চীনা, ইংরেজি, জাপানি, কোরীয় এবং কন্টোনেট ভাষার সমর্থন করে।
স্ট্রিমিং সমর্থন
বাস্তব-সময়ের অ্যাপ্লিকেশন এবং মিথস্ক্রিয় সিস্টেমের জন্য কম-বিলম্ব স্ট্রিমিং মোড।
প্রাকৃতিক শব্দভাণ্ডার
উন্নত প্রসোডি মডেলিং উপযুক্ত উচ্চারণের সাথে প্রাকৃতিক-স্বরযুক্ত কথাবার্তা তৈরি করে।
ব্যবহারের ক্ষেত্রে
ব্যবহারের নিয়ম কোসিভয়েস২Name
-
1
নিবন্ধন করুন এবং বিনামূল্যে ক্রেডিট দাবি করুন
Create a free TextToSpeechAI account to claim your starter credits, or try the demo first. No GPU or local CosyVoice2 install is needed - everything runs on our infrastructure.
-
2
CosyVoice2 নির্বাচন করুন এবং একটি রেফারেন্স ক্লিপ যোগ করুন
আপনার ইঞ্জিন হিসেবে CosyVoice2 বেছে নিন, তারপর আপনি যে কণ্ঠ ক্লোন করতে চান তার একটি পরিষ্কার ৩-১০ সেকেন্ড রেফারেন্স রেকর্ড আপলোড করুন। CosyVoice2 ক্লোন করার জন্য স্পিকারের বৈশিষ্ট্য বের করে আনবে।
-
3
যেকোন সমর্থিত ভাষায় আপনার লেখা লিখুন
চীনা, ইংরেজি, জাপানি, কোরীয়, অথবা ক্যান্টোনিজ ভাষায় আপনার স্ক্রিপ্ট টাইপ অথবা সাঁটান। CosyVoice2 ক্রস-লিঙ্গুইজম সমর্থন করে, তাই ক্লোন করা কণ্ঠ রেফারেন্স ক্লিপের থেকে ভিন্ন ভাষায় কথা বলতে পারে।
-
4
বক্তৃতা তৈরি করো
ক্লিক করে তৈরি করুন এবং CosyVoice2 ক্লোন করা কণ্ঠে প্রাকৃতিক, বহুভাষিক কথাবার্তা সংশ্লেষিত করে, সাধারণত সংক্ষিপ্ত টেক্সটের জন্য সেকেন্ডের মধ্যে। প্রাইম-ট্রিম ব্যবহারের খরচ প্রতি ১,০০০ অক্ষরের জন্য ২৫ ক্রেডিট।
-
5
API ডাউনলোড অথবা ব্যবহার করুন
Download the finished audio as MP3 or WAV from your history, or automate CosyVoice2 voice cloning at scale through the TextToSpeechAI REST API.
কোসিভয়েস২Name অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)
TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "কোসিভয়েস২ স্বভাবিক বহুভাষী কথা বলার সুযোগ দেয়, যার সাথে আছে শূন্য\u002Dশট কণ্ঠ ক্লোনিং ক্ষমতা।",
"voice": "en_US-lessac-medium"
}'
প্রায়শই জিজ্ঞাসিত প্রশ্ন
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25