কোসিভয়েস২Name

Premium

স্ট্রিমিং সমর্থনের সাথে জিরো-শট বহুভাষী শব্দ ক্লোনিং

বিনামূল্যে চেষ্টা করুন কোসিভয়েস২Name শব্দ ব্রাউজ করুন (0)

Fast গতি

Very Good গুণমান

হ্যাঁ ক্লোনিং

5 ভাষা

পরিচিতি কোসিভয়েস২Name

CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.

প্রধান বৈশিষ্ট্য

Zero-Shot ভয়েস ক্লোনিং

উচ্চ নির্ভরযোগ্যতার সাথে রেফারেন্স অডিও থেকে ৩-১০ সেকেন্ডের যেকোন শব্দ ক্লোন করুন।

বহুভাষিক

চীনা, ইংরেজি, জাপানি, কোরীয় এবং কন্টোনেট ভাষার সমর্থন করে।

স্ট্রিমিং সমর্থন

বাস্তব-সময়ের অ্যাপ্লিকেশন এবং মিথস্ক্রিয় সিস্টেমের জন্য কম-বিলম্ব স্ট্রিমিং মোড।

প্রাকৃতিক শব্দভাণ্ডার

উন্নত প্রসোডি মডেলিং উপযুক্ত উচ্চারণের সাথে প্রাকৃতিক-স্বরযুক্ত কথাবার্তা তৈরি করে।

ব্যবহারের ক্ষেত্রে

বহুভাষিক বিষয়বস্তু সৃষ্টি বাস্তব-সময়ের শব্দ সহায়ক ক্রস- ভাষায় ডাবিং ব্যক্তিগতকৃত শব্দ অ্যাপ্লিকেশন

ব্যবহারের নিয়ম কোসিভয়েস২Name

1

নিবন্ধন করুন এবং বিনামূল্যে ক্রেডিট দাবি করুন

Create a free TextToSpeechAI account to claim your starter credits, or try the demo first. No GPU or local CosyVoice2 install is needed - everything runs on our infrastructure.
2

CosyVoice2 নির্বাচন করুন এবং একটি রেফারেন্স ক্লিপ যোগ করুন

আপনার ইঞ্জিন হিসেবে CosyVoice2 বেছে নিন, তারপর আপনি যে কণ্ঠ ক্লোন করতে চান তার একটি পরিষ্কার ৩-১০ সেকেন্ড রেফারেন্স রেকর্ড আপলোড করুন। CosyVoice2 ক্লোন করার জন্য স্পিকারের বৈশিষ্ট্য বের করে আনবে।
3

যেকোন সমর্থিত ভাষায় আপনার লেখা লিখুন

চীনা, ইংরেজি, জাপানি, কোরীয়, অথবা ক্যান্টোনিজ ভাষায় আপনার স্ক্রিপ্ট টাইপ অথবা সাঁটান। CosyVoice2 ক্রস-লিঙ্গুইজম সমর্থন করে, তাই ক্লোন করা কণ্ঠ রেফারেন্স ক্লিপের থেকে ভিন্ন ভাষায় কথা বলতে পারে।
4

বক্তৃতা তৈরি করো

ক্লিক করে তৈরি করুন এবং CosyVoice2 ক্লোন করা কণ্ঠে প্রাকৃতিক, বহুভাষিক কথাবার্তা সংশ্লেষিত করে, সাধারণত সংক্ষিপ্ত টেক্সটের জন্য সেকেন্ডের মধ্যে। প্রাইম-ট্রিম ব্যবহারের খরচ প্রতি ১,০০০ অক্ষরের জন্য ২৫ ক্রেডিট।
5

API ডাউনলোড অথবা ব্যবহার করুন

Download the finished audio as MP3 or WAV from your history, or automate CosyVoice2 voice cloning at scale through the TextToSpeechAI REST API.

কোসিভয়েস২Name অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "কোসিভয়েস২ স্বভাবিক বহুভাষী কথা বলার সুযোগ দেয়, যার সাথে আছে শূন্য\u002Dশট কণ্ঠ ক্লোনিং ক্ষমতা।",
    "voice": "en_US-lessac-medium"
  }'

API ডকুমেন্ট পড়ুন আপনার API কী পান

প্রায়শই জিজ্ঞাসিত প্রশ্ন

CosyVoice2 হচ্ছে FunAudioLLM (Alibaba) থেকে একটি পরবর্তী প্রজন্মের টেক্সট-টু-স্পিকার এবং শব্দ ক্লোন মডেল। এটি শুধুমাত্র কয়েক সেকেন্ডের রেফারেন্স অডিও থেকে শূন্য-শট শব্দ ক্লোন সমর্থন করে এবং চীনা, ইংরেজি, জাপানি, কোরীয় এবং কান্টোনিজ ভাষায় স্বাভাবিক শব্দ সংশ্লেষণ করতে পারে। TextToSpeechAI এ আপনি কোন স্থানীয় সেটিংস ছাড়াই ব্রাউজার থেকে CosyVoice2 চালাতে পারেন।

হ্যাঁ, CosyVoice2 সম্পূর্ণভাবে অ্যাপাচি ২. ০ লাইসেন্সপ্রাপ্ত - কোড এবং মডেল উভয়ই। এটি বাণিজ্যিক পণ্য, পরিশোধিত বিষয়বস্তু এবং ক্লায়েন্ট কাজের জন্য লাইসেন্স ফি বা অবাণিজ্যিক সীমাবদ্ধতা ছাড়া ব্যবহারের জন্য নিরাপদ করে তোলে।

CosyVoice2 পাঁচটি ভাষা সমর্থন করে: চীনা (ম্যান্ডারিন), ইংরেজি, জাপানি, কোরীয়, এবং ক্যান্টোনিজ। এটি ক্রস-ভাষা সংশ্লেষণও পরিচালনা করে, তাই আপনি একটি ভাষার রেকর্ড থেকে একটি কণ্ঠস্বর ক্লোন করতে পারেন এবং অন্য ভাষায় কথা বলা তৈরি করতে পারেন।

লক্ষ্য স্পিকারের ৩-১০ সেকেন্ডের পরিষ্কার রেফারেন্স অডিও প্রদান করুন। CosyVoice2 একটি পরিসীমা স্কেলার কোয়ান্টাইজেশন পদ্ধতি ব্যবহার করে স্পিকারের বৈশিষ্ট্য বের করে, তারপর সমর্থিত যেকোন ভাষার মধ্যে সেই ক্লোন করা শব্দে নতুন কথা তৈরি করে। কোন মডেল প্রশিক্ষণ বা ফিন-টুইনের প্রয়োজন নেই।

কোসিভয়েস২ হচ্ছে সবচেয়ে শক্তিশালী বহুভাষিক ক্লোনিং মডেল, যা রেফারেন্স ক্লিপ থেকে ভিন্ন ভাষায় কথা বলার সময়ও স্পিকারের পরিচয় সংরক্ষণ করে। এটি প্রাকৃতিক শব্দ ও উচ্চারণ তৈরি করে, যা একে ক্রস- ভাষায় শব্দের অনুবাদ এবং স্থানীয় বিষয়বস্তু তৈরির জন্য উপযুক্ত করে তোলে।

Yes. CosyVoice2 is a fast model and includes a streaming mode that produces audio with low latency, making it suitable for voice assistants and interactive applications. On TextToSpeechAI generations typically complete in seconds for short text.

CosyVoice2 requires about 4-6GB of VRAM for the 0.5B parameter model, so a GPU with 6GB or more is recommended when self-hosting. On TextToSpeechAI the model runs on our GPU infrastructure, so you do not need any hardware of your own.

CosyVoice2 একটি প্রিমিয়াম-ট্রিম মডেল এবং প্রতি ১,০০০ অক্ষরের জন্য ২৫ ক্রেডিট খরচ হয়। প্রতিটি নতুন অ্যাকাউন্ট বিনামূল্যে স্টার্টার ক্রেডিট পায়, তাই আপনি CosyVoice2 শব্দ ক্লোনিং পরীক্ষা করতে পারেন একটি পরিশোধিত পরিকল্পনার সিদ্ধান্ত নেওয়ার আগে।

উভয়ই প্রাইম ভয়েস ক্লোনিং ইঞ্জিন। GPT-SoVITS সাধারণত একক লক্ষ্য ভয়েসের জন্য সর্বোচ্চ কাঁচা অনুরূপতা অর্জন করে, যখন CosyVoice2 বহুভাষিক এবং ক্রস-ভাষিক ক্লোনিংয়ের জন্য শক্তিশালী এবং একটি কম-লাটেন্সি স্ট্রিমিং মোড যোগ করে। যখন একাধিক ভাষায় কথা বলার জন্য একটি ক্লোন করা ভয়েস প্রয়োজন হয় তখন CosyVoice2 বেছে নিন।

উভয়ই উচ্চমানের জিরো-শট ভয়েস ক্লোনিং প্রদান করে। CosyVoice2 আরো ভাষা সমর্থন করে (৫ versus ২) এবং বাস্তব-সময় ব্যবহারের জন্য স্ট্রিমিং যোগ করে, যেখানে F5-TTS শুধুমাত্র ইংরেজি-ভিত্তিক কাজের জন্য সামান্য দ্রুত হতে পারে। বহুভাষিক প্রকল্পের জন্য CosyVoice2 সাধারণত ভালভাবে মানানসই।

TextToSpeechAI আপনাকে MP3 এবং WAV এর মত সাধারণ ফরম্যাটে CosyVoice2 প্রজন্ম রপ্তানি করতে দেয়। আপনি আপনার ইতিহাস পৃষ্ঠা থেকে সরাসরি ফাইল ডাউনলোড করতে পারেন অথবা TextToSpeechAI API এর মাধ্যমে প্রোগ্রামিং করে এটি পুনরুদ্ধার করতে পারেন।

Yes. You can test CosyVoice2 with the free demo and your free starter credits on TextToSpeechAI without installing anything. Just sign up, upload a short reference clip, type your text in any supported language, and generate.

Technical Specs

Generation Speed Fast
Output Quality Very Good
Voice Cloning Supported
Languages 5
GPU VRAM 4-6GB
Credits/1000 chars 25

Try কোসিভয়েস২Name Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

কোসিভয়েস২Name

পরিচিতি কোসিভয়েস২Name

প্রধান বৈশিষ্ট্য

Zero-Shot ভয়েস ক্লোনিং

বহুভাষিক

স্ট্রিমিং সমর্থন

প্রাকৃতিক শব্দভাণ্ডার

ব্যবহারের ক্ষেত্রে

ব্যবহারের নিয়ম কোসিভয়েস২Name

নিবন্ধন করুন এবং বিনামূল্যে ক্রেডিট দাবি করুন

CosyVoice2 নির্বাচন করুন এবং একটি রেফারেন্স ক্লিপ যোগ করুন

যেকোন সমর্থিত ভাষায় আপনার লেখা লিখুন

বক্তৃতা তৈরি করো

API ডাউনলোড অথবা ব্যবহার করুন

কোসিভয়েস২Name অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

প্রায়শই জিজ্ঞাসিত প্রশ্ন

কোসিভয়েস২ কি?

বাণিজ্যিকভাবে কোসিভয়েস২ কি মুক্তভাবে ব্যবহার করা যায়?

কোন ভাষাগুলো CosyVoice2 সমর্থন করে?

কোসিভয়েস২ ভয়েস ক্লোনিং কিভাবে কাজ করে?

কসিভয়েস২ কতটা ভালো কতকগুলো ভাষার কণ্ঠ ক্লোন করতে পারে?

কোসিভয়েস২ কি বাস্তব সময় ব্যবহারের জন্য যথেষ্ট দ্রুত?

CosyVoice2-এর কত GPU মেমরি প্রয়োজন?

কত ক্রেডিট CosyVoice2 TextToSpeechAI উপর খরচ হয়?

CosyVoice2 বনাম GPT-SoVITS - কোনটি ব্যবহার করা উচিত?

F5-TTS এর সাথে CosyVoice2 কিভাবে তুলনা করা যায়?

CosyVoice2 থেকে আমি কি ধরনের অডিও ডাউনলোড করতে পারি?

আমি কি CosyVoice2 বিনামূল্যে ব্যবহার করতে পারি?

Technical Specs

Try কোসিভয়েস২Name Now

Other TTS Engines

পাতলা

চ্যাটবক্স

দিন