চ্যাটবক্স

Premium

২৩টি ভাষায় অভিব্যক্তিমূলক কথার সাথে জিরো-শট ভয়েস ক্লোনিং

Fast গতি
Very Good গুণমান
হ্যাঁ ক্লোনিং
23 ভাষা

পরিচিতি চ্যাটবক্স

Chatterbox is a powerful voice cloning TTS model from Resemble AI. It performs zero-shot voice cloning from just a few seconds of reference audio, supporting 23 languages with natural expression. Chatterbox includes paralinguistic tags for adding natural sounds like laughter and coughs to generated speech.

প্রধান বৈশিষ্ট্য

Zero-Shot ভয়েস ক্লোনিং

অডিও থেকে কয়েক সেকেন্ডের মধ্যে যে কোন শব্দ ক্লোন করুন - কোন প্রশিক্ষণ প্রয়োজন নেই।

২৩টি ভাষা

আরবি থেকে চীনা, বিশ্বের সবচেয়ে বড় ভাষাগুলোকেও তারা আচ্ছাদিত করেছে।

এক্সপ্রেশনাল ট্যাগ

স্বাভাবিক ভাষাগত শব্দের জন্য [হাসি], [কাশি], [খুশি] যোগ করুন।

দ্রুত অনুমান

টর্বো সংস্করণের মাধ্যমে ২০০ মিলিসেকেন্ডের কম সময়ে বাস্তব সময়ের অ্যাপ্লিকেশন চালানো সম্ভব।

ব্যবহারের ক্ষেত্রে

বিষয়বস্তু সৃষ্টির জন্য শব্দ ক্লোনিং বহুভাষিক শব্দ অ্যাপ্লিকেশন খেলার জন্য অক্ষর শব্দ নকশা ব্যক্তিগতকৃত শব্দ সহায়ক

ব্যবহারের নিয়ম চ্যাটবক্স

  1. 1

    নিবন্ধন করুন অথবা ডেমো খুলুন

    Create a free TextToSpeechAI account to claim 200 starter credits, or use the on-page demo to try Chatterbox without signing in.

  2. 2

    চ্যাটবক্স নির্বাচন করুন এবং একটি রেফারেন্স ক্লিপ যোগ করুন

    চ্যাটার্বোক্স ইঞ্জিন বেছে নিন, তারপর আপনি যে কন্ঠটি ক্লোন করতে চান তার একটি অডিও ক্লিপ আপলোড করুন। চ্যাটার্বোক্স জিরো-শট এটিকে ক্লোন করে - কোন প্রশিক্ষণ প্রয়োজন নেই।

  3. 3

    ইচ্ছাকৃত ট্যাগ সহ আপনার লেখা লিখুন

    ২৩টি সমর্থিত ভাষার যে কোন একটিতে কথা বলার জন্য লেখা টাইপ অথবা পেস্ট করুন এবং যেখানেই আপনি প্রাকৃতিক প্যারালিঙ্গুইস্টিক শব্দ চান সেখানে [হাসি], [কাশি] অথবা [খুশি] ট্যাগটি রাখুন।

  4. 4

    বক্তৃতা তৈরি করো

    ক্লিক করুন এবং TextToSpeechAI আপনার টেক্সটকে ক্লোন করা চ্যাটবক্সের কন্ঠে হোস্ট করা GPU অবকাঠামোতে প্রদর্শন করবে, প্রতি 1000 অক্ষর ২৫ ক্রেডিট ব্যয় করবে।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    Download the finished audio file, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com using your account token.

চ্যাটবক্স অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "চ্যাটার্বক্স আপনার কণ্ঠস্বরকে কয়েক সেকেন্ডের অডিও থেকে ক্লোন করে এবং ২৩টি ভাষায় কথা বলতে পারে।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

চ্যাটারবক্স রিসেম্বল এআই এর একটি শূন্য-শট কন্ঠ ক্লোনিং টেক্সট-টু-স্পিকার মডেল। এটি কয়েক সেকেন্ডের রেফারেন্স অডিও থেকে যে কোন কন্ঠের অনুরূপ তৈরি করতে পারে এবং ২৩টি ভাষায় স্বাভাবিক, অভিব্যক্তিমূলক কথাবার্তা তৈরি করতে পারে, সবকিছুই কোন কন্ঠ প্রশিক্ষণ ছাড়াই।

হ্যাঁ, চ্যাটবক্স সম্পূর্ণ এমআইটি লাইসেন্সপ্রাপ্ত - কোড এবং মডেল উভয়ই - তাই আপনি এটি বাণিজ্যিক পণ্য হিসেবে মুক্তভাবে ব্যবহার করতে পারেন। তৈরিকৃত অডিওতে একটি বৈকল্পিক নিউরাল ওয়াটারমার্ক অন্তর্ভুক্ত রয়েছে যা নিষ্ক্রিয় করা যেতে পারে, এবং এর ব্যবহারের জন্য কোন মুক্ত ব্যবহারের অনুমতি নেই।

আপনি যে কোন কন্ঠের একটি সংক্ষিপ্ত রেফারেন্স ক্লিপ প্রদান করেন (কয়েক সেকেন্ড যথেষ্ট) এবং চ্যাটবক্স সেই কন্ঠের টাইমব্রে এবং স্টাইলকে স্পিকারের অন্তর্ভুক্তিতে বের করে নেয়। এরপর এটি সেই কন্ঠে কোন ফিন-টুইনিং বা প্রশিক্ষণ পদক্ষেপ ছাড়াই নতুন শব্দ তৈরি করে, যা "শূন্য-শট" এর অর্থ।

চ্যাটবক্স আপনার লেখায় বিশেষ ইনলাইন ট্যাগ পড়ে প্রাকৃতিক অবাক্যগত শব্দ যোগ করে: [হাসি] হাসির শব্দ যোগ করে, [কাশি] কাশি যোগ করে, এবং [খুশি] খুশির শব্দ যোগ করে। শুধুমাত্র যেখানে আপনি শব্দটি চান সেখানে ট্যাগটি রাখুন, উদাহরণস্বরূপ "এটা মজার [হাসি] কিন্তু সত্যিই..."।

শব্দটি যেখানে হতে হবে, সেই জায়গায় আপনার ইনপুট টেক্সটের মধ্যে সরাসরি ট্যাগটি টাইপ করুন, বাকী বাক্য দ্বারা ঘিরে। চ্যাটবক্স ক্লোন করা কন্ঠে প্যারালিঙ্গুইস্টিক শব্দটি প্রদর্শন করে, এটিকে পরিবেশের কথার সাথে মিশিয়ে দেয় যাতে এটি স্প্লিচ করার পরিবর্তে স্বাভাবিকভাবে শোনা যায়।

চ্যাটবক্স ২৩টি ভাষা সমর্থন করে, যার মধ্যে রয়েছে আরবি, ডেনমার্ক, জার্মান, গ্রিক, ইংরেজি, স্প্যানিশ, ফিনল্যান্ড, ফরাসি, হিব্রু, হিন্দি, ইতালীয়, জাপানি, কোরীয়, মালয়, ডাচ, নরওয়েজীয়, পোলিশ, পর্তুগিজ, রুশ, সুইডিশ, সোয়াহিলি, তুর্কি এবং চীনা। একক ক্লোন করা কণ্ঠ এই সকল ভাষায় কথা বলতে পারে।

চ্যাটবক্স একটি জিপিইউ-তে দ্রুত কথাবার্তা তৈরি করে, এবং টারবারো সংস্করণটি বাস্তব-সময়ের কথাবার্তার জন্য সাব-২০০ মিলিসেকেন্ডের লেটেন্সিতে পৌঁছে যায়। গুণমান খুবই ভাল, প্রাকৃতিক প্রসোডি এবং স্বচ্ছ শব্দের সাথে, এমনকি ছোট রেফারেন্স ক্লিপ থেকেও।

Chatterbox needs roughly 4-8GB of VRAM depending on the variant, with the Turbo model running comfortably in about 4GB. On TextToSpeechAI you do not need any local GPU - generation runs on our hosted infrastructure.

চ্যাটারবক্স একটি প্রিমিয়াম-ট্রিম ইঞ্জিন যা প্রতি ১০০০ অক্ষরের জন্য ২৫ ক্রেডিট খরচ করে। নতুন অ্যাকাউন্টের জন্য ২০০ ক্রেডিট বিনামূল্যে পাওয়া যায়, যাতে তারা ভয়েস ক্লোনিং পরীক্ষা করতে পারে। আপনি শুধুমাত্র আপনার তৈরি করা টেক্সট-এ ক্রেডিট খরচ করতে পারেন।

উভয়ই শূন্য-শট ভয়েস ক্লোনিং সমর্থন করে, কিন্তু চ্যাটার্বোক্স অনেক বেশি ভাষা (২৩ বনাম ২) আচ্ছাদন করে এবং অভিব্যক্তিগত প্যারালিঙ্গুইস্টিক ট্যাগ যোগ করে। F5-TTS ইংরেজি শব্দের আরো স্বাভাবিক উচ্চারণ করতে পারে, তাই মাল্টিলিঙ্গুইস্টিক ক্লোনিং এবং অভিব্যক্তিমূলক শব্দের জন্য চ্যাটার্বোক্স বেছে নিন, এবং F5-TTS শুধু ইংরেজি-নির্ভরতার জন্য।

উভয়ই উচ্চমানের শব্দ ক্লোনিং প্রদান করে। চ্যাটার্বোক্স ২৩টি ভাষা এবং ইনলাইন অভিব্যক্তিমূলক ট্যাগ সমর্থন করে, যখন ওপেনভয়েস টোন-স্টাইল নিয়ন্ত্রণ যোগ করে (বন্ধুত্বপূর্ণ, দুঃখী, ক্ষুব্ধ, এবং আরও বেশি) যা চ্যাটার্বোক্সের অভাব। চ্যাটার্বোক্সকে বেছে নিন বিস্তৃত ভাষার জন্য এবং ওপেনভয়েসকে বেছে নিন যখন আপনার স্পষ্টভাবে আবেগপূর্ণ টোন স্টাইলিং প্রয়োজন।

Yes. Sign up for a free TextToSpeechAI account to receive 200 starter credits, or use the on-page demo to hear Chatterbox without signing in. Upload a short reference clip, type your text, and generate a cloned voice in seconds.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try চ্যাটবক্স Now

Generate your first audio free. No credit card required.

Start Free