ক্ষেত্র

Ultra

আবেগ এবং শৈলী নিয়ন্ত্রণ সঙ্গে অভিব্যক্তিমূলক ভয়েস ক্লোনিং

Medium গতি
Excellent গুণমান
হ্যাঁ ক্লোনিং
5 ভাষা

পরিচিতি ক্ষেত্র

s.

প্রধান বৈশিষ্ট্য

আবেগ নিয়ন্ত্রণ

কন্ট্রোল স্পিকারের আবেগ: সুখ, দুঃখ, রাগ, ভয়, অবাক হওয়া, বিরক্ত এবং নিরপেক্ষ।

শব্দ ক্লোনিং

উচ্চ নির্ভরযোগ্যতার সাথে রেফারেন্স অডিও থেকে ৫-৩০ সেকেন্ডের যেকোন শব্দ ক্লোন করুন।

অভিব্যক্তিমূলক বক্তৃতা

১.৬বি প্যারামিটার উচ্চারণশীল কথা বলার জন্য ব্যবহার করা হয়, যা অনুভূতির সাথে মিলে যায়।

বহুভাষিক

ইংরেজি, জাপানি, চীনা, ফরাসি এবং জার্মান সমর্থন করে।

ব্যবহারের ক্ষেত্রে

আবেগপূর্ণভাবে প্রকাশিত বিষয়বস্তু সৃষ্টি ইমোটস সহযোগে খেলার চরিত্রের কণ্ঠস্বর আবহ সহ অডিওবুক বর্ণনা মিথস্ক্রিয় শব্দ অভিজ্ঞতা

ব্যবহারের নিয়ম ক্ষেত্র

  1. 1

    নিবন্ধন করুন অথবা ডেমো খুলুন

    Create a free TextToSpeechAI account to get starter credits, or use the no-signup demo to try Zonos right away.

  2. 2

    Zonos ইঞ্জিন নির্বাচন করুন

    শব্দ এবং মডেল নির্বাচনকারী থেকে Zonos নির্বাচন করুন। একটি শব্দ ক্লোন করতে, ৫-৩০ সেকেন্ডের পরিষ্কার রেফারেন্স অডিও আপলোড করুন যাতে Zonos স্পিকারের সাথে মিল রাখতে পারে।

  3. 3

    আপনার লেখা লিখুন

    আপনি যে স্ক্রিপ্টটি বলতে চান তা টাইপ অথবা পেস্ট করুন। Zonos ইংরেজি, জাপানি, চীনা, ফরাসি এবং জার্মান ভাষায় কাজ করে।

  4. 4

    একটি আবেগ বেছে নিন এবং তৈরি করুন

    সাতটি জোনোস আবেগ-এর মধ্যে একটি বেছে নিন - নিরপেক্ষ, সুখ, দুঃখ, রেগে যাওয়া, ভয়, অবাক হওয়া, অথবা বিতৃষ্ণা - তারপর এই আবেগ-এর সাথে অভিব্যক্তিমূলক কথা বলার জন্য তৈরি করো ক্লিক করুন।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    Play back and download the finished audio, or call the same Zonos engine programmatically through the TextToSpeechAI REST API for automated workflows.

ক্ষেত্র অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "জোনোস অসাধারণভাবে স্পষ্টভাষী কথাবার্তার সৃষ্টি করে, যা আবেগের নিয়ন্ত্রণে থাকে।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

Zonos is a 1.6B parameter text-to-speech model from Zyphra. It specializes in expressive speech generation with fine-grained emotion control and high-fidelity voice cloning. On TextToSpeechAI it runs as an ultra-tier engine for the most nuanced, emotionally rich audio.

হ্যাঁ। জোনোস এর কোড এবং মডেল উভয়ের জন্যই অ্যাপাচি ২.০ লাইসেন্সের অধীনে প্রকাশিত হয়েছে, তাই এটি বাণিজ্যিক পণ্য হিসেবে মুক্তভাবে ব্যবহার করা যেতে পারে, কোন ধরনের স্বীকৃতি বা বাণিজ্যিক সীমাবদ্ধতা ছাড়াই। এটি এটিকে নিরাপদ করে তোলে, যেখানে টাকা দিয়ে অ্যাপস, ক্লায়েন্ট কাজ এবং অর্থ উপার্জন করা যায়।

জোনোস সাতটি আবেগময় অবস্থার - নিরপেক্ষ, আনন্দ, দুঃখ, রেগে যাওয়া, ভয়, অবাক হওয়া এবং বিরক্ত হওয়া - প্রকাশ করে যা আপনি তৈরি করার আগে বেছে নেন। মডেলটি নির্বাচিত আবেগ, পরিবর্তনশীল টোন, গতি এবং উচ্চারণ অনুযায়ী তার প্রদান করে, যাতে একই বাক্যটি আনন্দময় বা রেগে যাওয়ার মতো শোনাতে পারে। এটি জোনোসকে চরিত্রের কণ্ঠস্বর এবং আলাপচারিতার জন্য উপযুক্ত করে তোলে যা একটি নির্দিষ্ট আবেগ প্রয়োজন।

জোনোস সাতটি আবেগগত বৈশিষ্ট্য সমর্থন করে: নিরপেক্ষ, আনন্দ, দুঃখ, রেগে যাওয়া, ভয়, অবাক হওয়া এবং বিতৃষ্ণা। প্রতি প্রজন্মে আপনি একটি বেছে নেন যাতে সমগ্র ক্লিপের আবেগগত টোন নির্ধারণ করা যায়।

হ্যাঁ। জোনোস মাত্র ৫-৩০ সেকেন্ডের রেফারেন্স অডিও থেকে একটি কণ্ঠ ক্লোন করে, স্পিকারের বৈশিষ্ট্য বের করে এবং তাদের নতুন কথায় পুনঃপ্রতিষ্ঠা করে। আপনি ক্লোনিং-এর সাথে সাতটি আবেগকে একত্রিত করতে পারেন একটি ক্লোন করা কণ্ঠকে সুখী, ক্ষুব্ধ, বা ভয়ঙ্কর করে তোলার জন্য।

জোনোস পাঁচটি ভাষার সমর্থন করে: ইংরেজি, জাপানি, চীনা, ফরাসি এবং জার্মান। এই সব ভাষার মধ্যেই ইমোশন কন্ট্রোল এবং ভয়েস ক্লোনিং কাজ করে।

জোনোস এর ১.৬ বিট প্যারামিটার আকার এর কারণে মাঝারি গতিতে চলতে পারে, কাঁচা প্রবাহের জন্য বিনিময় করে, চমৎকার, উচ্চাঙ্গ আউটপুট। গুণমান আবেগপূর্ণ এবং ক্লোন করা বক্তব্যের জন্য সেরা, তাই এটি বাল্ক রিয়েল-টাইম উৎপাদনের পরিবর্তে শেষ উৎপাদন অডিও জন্য উপযুক্ত।

Zonos requires 8GB or more of VRAM for its 1.6B parameter model. A GPU with at least 10GB is recommended for comfortable operation when combining voice cloning with emotion control. On TextToSpeechAI all of this runs on our GPU backend, so you need no hardware of your own.

জোনোস একটি আল্ট্রা-টিয়ার ইঞ্জিন, প্রতি ১০০০ অক্ষরের জন্য ৫০ ক্রেডিট বিল করা হয়। আল্ট্রা-টিয়ার এর বড় মডেল এবং উন্নত আবেগ এবং ক্লোনিং ক্ষমতা প্রতিফলিত করে, StyleTTS2, Tortoise এবং OpenVoice এর মত একই স্তর।

উভয়ই শব্দের ক্লোনিংয়ের মাধ্যমে স্টাইল এবং আবেগ নিয়ন্ত্রণ প্রদান করে। Zonos সাতটি পৃথক আবেগ অবস্থা এবং একটি আধুনিক ১. ৬বি স্থাপত্য প্রদান করে, যখন OpenVoice খুব দ্রুত ক্লোনিংয়ের সাথে বন্ধুত্বপূর্ণ, উচ্ছ্বসিত এবং চুপচাপ টোন স্টাইল প্রদান করে। স্পষ্ট আবেগ নির্বাচন এবং সর্বোচ্চ প্রকাশের জন্য Zonos বেছে নিন; হালকা, দ্রুত টোন পরিবর্তনের জন্য OpenVoice বেছে নিন।

বার্ক [হাসি] এবং [শ্বাস] এর মত অভিব্যক্তিমূলক চিহ্ন যোগ করে কিন্তু সীমিত ক্লোনিং প্রদান করে, এবং ডায়া অবাক্যগত শব্দ সহ বহু-স্পিকার ডায়ালগ-এ মনোযোগ প্রদান করে। জোনোস স্পষ্ট আবেগ নির্বাচনের উপর মনোযোগ প্রদান করে এবং শক্তিশালী একক-আওয়াজ ক্লোনিং, আপনাকে প্রতিটি ক্লিপের আবেগ সম্পর্কে সঠিক নিয়ন্ত্রণ প্রদান করে। ইমোশন ট্যাগ, ডায়ালগ টুরিং, বা নির্বাচনযোগ্য আবেগ প্রয়োজন হলে ইঞ্জিনটি বেছে নিন যা আপনার সাথে মেলে।

Yes. New TextToSpeechAI accounts get free starter credits, and the demo lets you generate sample audio without signing up. That is enough to test Zonos emotion control and voice cloning before buying additional credits.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try ক্ষেত্র Now

Generate your first audio free. No credit card required.

Start Free