কোসিভয়েস২Name

Premium

স্ট্রিমিং সমর্থনের সাথে জিরো-শট বহুভাষী শব্দ ক্লোনিং

Fast গতি
Very Good গুণমান
হ্যাঁ ক্লোনিং
5 ভাষা

পরিচিতি কোসিভয়েস২Name

CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.

প্রধান বৈশিষ্ট্য

Zero-Shot ভয়েস ক্লোনিং

উচ্চ নির্ভরযোগ্যতার সাথে রেফারেন্স অডিও থেকে ৩-১০ সেকেন্ডের যেকোন শব্দ ক্লোন করুন।

বহুভাষিক

চীনা, ইংরেজি, জাপানি, কোরীয় এবং কন্টোনেট ভাষার সমর্থন করে।

স্ট্রিমিং সমর্থন

বাস্তব-সময়ের অ্যাপ্লিকেশন এবং মিথস্ক্রিয় সিস্টেমের জন্য কম-বিলম্ব স্ট্রিমিং মোড।

প্রাকৃতিক শব্দভাণ্ডার

উন্নত প্রসোডি মডেলিং উপযুক্ত উচ্চারণের সাথে প্রাকৃতিক-স্বরযুক্ত কথাবার্তা তৈরি করে।

ব্যবহারের ক্ষেত্রে

বহুভাষিক বিষয়বস্তু সৃষ্টি বাস্তব-সময়ের শব্দ সহায়ক ক্রস- ভাষায় ডাবিং ব্যক্তিগতকৃত শব্দ অ্যাপ্লিকেশন

ব্যবহারের নিয়ম কোসিভয়েস২Name

  1. 1

    নিবন্ধন করুন এবং বিনামূল্যে ক্রেডিট দাবি করুন

    Create a free TextToSpeechAI account to claim your starter credits, or try the demo first. No GPU or local CosyVoice2 install is needed - everything runs on our infrastructure.

  2. 2

    CosyVoice2 নির্বাচন করুন এবং একটি রেফারেন্স ক্লিপ যোগ করুন

    আপনার ইঞ্জিন হিসেবে CosyVoice2 বেছে নিন, তারপর আপনি যে কণ্ঠ ক্লোন করতে চান তার একটি পরিষ্কার ৩-১০ সেকেন্ড রেফারেন্স রেকর্ড আপলোড করুন। CosyVoice2 ক্লোন করার জন্য স্পিকারের বৈশিষ্ট্য বের করে আনবে।

  3. 3

    যেকোন সমর্থিত ভাষায় আপনার লেখা লিখুন

    চীনা, ইংরেজি, জাপানি, কোরীয়, অথবা ক্যান্টোনিজ ভাষায় আপনার স্ক্রিপ্ট টাইপ অথবা সাঁটান। CosyVoice2 ক্রস-লিঙ্গুইজম সমর্থন করে, তাই ক্লোন করা কণ্ঠ রেফারেন্স ক্লিপের থেকে ভিন্ন ভাষায় কথা বলতে পারে।

  4. 4

    বক্তৃতা তৈরি করো

    ক্লিক করে তৈরি করুন এবং CosyVoice2 ক্লোন করা কণ্ঠে প্রাকৃতিক, বহুভাষিক কথাবার্তা সংশ্লেষিত করে, সাধারণত সংক্ষিপ্ত টেক্সটের জন্য সেকেন্ডের মধ্যে। প্রাইম-ট্রিম ব্যবহারের খরচ প্রতি ১,০০০ অক্ষরের জন্য ২৫ ক্রেডিট।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    Download the finished audio as MP3 or WAV from your history, or automate CosyVoice2 voice cloning at scale through the TextToSpeechAI REST API.

কোসিভয়েস২Name অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "কোসিভয়েস২ স্বভাবিক বহুভাষী কথা বলার সুযোগ দেয়, যার সাথে আছে শূন্য\u002Dশট কণ্ঠ ক্লোনিং ক্ষমতা।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

CosyVoice2 হচ্ছে FunAudioLLM (Alibaba) থেকে একটি পরবর্তী প্রজন্মের টেক্সট-টু-স্পিকার এবং শব্দ ক্লোন মডেল। এটি শুধুমাত্র কয়েক সেকেন্ডের রেফারেন্স অডিও থেকে শূন্য-শট শব্দ ক্লোন সমর্থন করে এবং চীনা, ইংরেজি, জাপানি, কোরীয় এবং কান্টোনিজ ভাষায় স্বাভাবিক শব্দ সংশ্লেষণ করতে পারে। TextToSpeechAI এ আপনি কোন স্থানীয় সেটিংস ছাড়াই ব্রাউজার থেকে CosyVoice2 চালাতে পারেন।

হ্যাঁ, CosyVoice2 সম্পূর্ণভাবে অ্যাপাচি ২. ০ লাইসেন্সপ্রাপ্ত - কোড এবং মডেল উভয়ই। এটি বাণিজ্যিক পণ্য, পরিশোধিত বিষয়বস্তু এবং ক্লায়েন্ট কাজের জন্য লাইসেন্স ফি বা অবাণিজ্যিক সীমাবদ্ধতা ছাড়া ব্যবহারের জন্য নিরাপদ করে তোলে।

CosyVoice2 পাঁচটি ভাষা সমর্থন করে: চীনা (ম্যান্ডারিন), ইংরেজি, জাপানি, কোরীয়, এবং ক্যান্টোনিজ। এটি ক্রস-ভাষা সংশ্লেষণও পরিচালনা করে, তাই আপনি একটি ভাষার রেকর্ড থেকে একটি কণ্ঠস্বর ক্লোন করতে পারেন এবং অন্য ভাষায় কথা বলা তৈরি করতে পারেন।

লক্ষ্য স্পিকারের ৩-১০ সেকেন্ডের পরিষ্কার রেফারেন্স অডিও প্রদান করুন। CosyVoice2 একটি পরিসীমা স্কেলার কোয়ান্টাইজেশন পদ্ধতি ব্যবহার করে স্পিকারের বৈশিষ্ট্য বের করে, তারপর সমর্থিত যেকোন ভাষার মধ্যে সেই ক্লোন করা শব্দে নতুন কথা তৈরি করে। কোন মডেল প্রশিক্ষণ বা ফিন-টুইনের প্রয়োজন নেই।

কোসিভয়েস২ হচ্ছে সবচেয়ে শক্তিশালী বহুভাষিক ক্লোনিং মডেল, যা রেফারেন্স ক্লিপ থেকে ভিন্ন ভাষায় কথা বলার সময়ও স্পিকারের পরিচয় সংরক্ষণ করে। এটি প্রাকৃতিক শব্দ ও উচ্চারণ তৈরি করে, যা একে ক্রস- ভাষায় শব্দের অনুবাদ এবং স্থানীয় বিষয়বস্তু তৈরির জন্য উপযুক্ত করে তোলে।

Yes. CosyVoice2 is a fast model and includes a streaming mode that produces audio with low latency, making it suitable for voice assistants and interactive applications. On TextToSpeechAI generations typically complete in seconds for short text.

CosyVoice2 requires about 4-6GB of VRAM for the 0.5B parameter model, so a GPU with 6GB or more is recommended when self-hosting. On TextToSpeechAI the model runs on our GPU infrastructure, so you do not need any hardware of your own.

CosyVoice2 একটি প্রিমিয়াম-ট্রিম মডেল এবং প্রতি ১,০০০ অক্ষরের জন্য ২৫ ক্রেডিট খরচ হয়। প্রতিটি নতুন অ্যাকাউন্ট বিনামূল্যে স্টার্টার ক্রেডিট পায়, তাই আপনি CosyVoice2 শব্দ ক্লোনিং পরীক্ষা করতে পারেন একটি পরিশোধিত পরিকল্পনার সিদ্ধান্ত নেওয়ার আগে।

উভয়ই প্রাইম ভয়েস ক্লোনিং ইঞ্জিন। GPT-SoVITS সাধারণত একক লক্ষ্য ভয়েসের জন্য সর্বোচ্চ কাঁচা অনুরূপতা অর্জন করে, যখন CosyVoice2 বহুভাষিক এবং ক্রস-ভাষিক ক্লোনিংয়ের জন্য শক্তিশালী এবং একটি কম-লাটেন্সি স্ট্রিমিং মোড যোগ করে। যখন একাধিক ভাষায় কথা বলার জন্য একটি ক্লোন করা ভয়েস প্রয়োজন হয় তখন CosyVoice2 বেছে নিন।

উভয়ই উচ্চমানের জিরো-শট ভয়েস ক্লোনিং প্রদান করে। CosyVoice2 আরো ভাষা সমর্থন করে (৫ versus ২) এবং বাস্তব-সময় ব্যবহারের জন্য স্ট্রিমিং যোগ করে, যেখানে F5-TTS শুধুমাত্র ইংরেজি-ভিত্তিক কাজের জন্য সামান্য দ্রুত হতে পারে। বহুভাষিক প্রকল্পের জন্য CosyVoice2 সাধারণত ভালভাবে মানানসই।

TextToSpeechAI আপনাকে MP3 এবং WAV এর মত সাধারণ ফরম্যাটে CosyVoice2 প্রজন্ম রপ্তানি করতে দেয়। আপনি আপনার ইতিহাস পৃষ্ঠা থেকে সরাসরি ফাইল ডাউনলোড করতে পারেন অথবা TextToSpeechAI API এর মাধ্যমে প্রোগ্রামিং করে এটি পুনরুদ্ধার করতে পারেন।

Yes. You can test CosyVoice2 with the free demo and your free starter credits on TextToSpeechAI without installing anything. Just sign up, upload a short reference clip, type your text in any supported language, and generate.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try কোসিভয়েস২Name Now

Generate your first audio free. No credit card required.

Start Free