মেলো- টিটিএস

Standard

প্রাকৃতিক প্রসোডির সাথে দ্রুত মাল্টি-অক্ষর TTS

Very Fast গতি
Good গুণমান
না ক্লোনিং
6 ভাষা

পরিচিতি মেলো- টিটিএস

MeloTTS is a fast, multi-accent text-to-speech model from MyShell AI. It supports multiple languages with authentic accent variations for English (American, British, Indian, Australian). MeloTTS runs at real-time speed on CPU, making it efficient for production deployments.

প্রধান বৈশিষ্ট্য

বহু- উচ্চারণ

একাধিক ইংরেজি উচ্চারণ: আমেরিকান, ব্রিটিশ, ভারতীয় এবং অস্ট্রেলিয়ান।

CPU রিয়েল-টাইম

GPU ছাড়া CPU-তে বাস্তব সময়ের সংশ্লেষণের জন্য যথেষ্ট দ্রুত।

ভাষা

ইংরেজি, স্প্যানিশ, ফরাসি, চীনা, জাপানি এবং কোরীয় ভাষা সমর্থন করে।

গতি নিয়ন্ত্রণ

আউটপুট সুনির্দিষ্ট করার জন্য কথা বলার গতি পরিবর্তন করা যায়।

ব্যবহারের ক্ষেত্রে

বহু-অক্ষর উচ্চারণকারী শব্দ অ্যাপ্লিকেশন আন্তর্জাতিক বিষয়বস্তু স্থানীয়করণ বাস্তব-সময়ের শব্দ সহায়ক উচ্চারণ বৈচিত্র্যের সাথে অডিওবুক উৎপাদন

ব্যবহারের নিয়ম মেলো- টিটিএস

  1. 1

    বিনামূল্যে নিবন্ধন করুন অথবা ডেমো চেষ্টা করুন

    Create a free TextToSpeechAI account to receive starter credits, or use the no-signup demo on the homepage to test MeloTTS instantly. Free credits are enough to evaluate several MeloTTS accents before you commit.

  2. 2

    একটি MeloTTS উচ্চারণ এবং শব্দ নির্বাচন করুন

    ভয়েস ব্রাউজার খুলুন এবং MeloTTS ফিল্টার করুন। আপনার দর্শকদের জন্য উপযুক্ত উচ্চারণ বেছে নিন, যেমন আমেরিকান, ব্রিটিশ, ভারতীয়, অথবা অস্ট্রেলিয়ান ইংরেজি, অথবা স্প্যানিশ, ফরাসি, চীনা, জাপানি, অথবা কোরীয় ভাষার স্বর।

  3. 3

    আপনার লেখা লিখুন

    আপনি যে স্ক্রিপ্টটি উচ্চারণ করতে চান তা টেক্সট বাক্সে টাইপ অথবা সাঁটান। MeloTTS স্বয়ংক্রিয়ভাবে প্রাকৃতিক উচ্চারণ ব্যবস্থাপনা করে, এবং আপনি আপনার নির্বাচিত উচ্চারণের জন্য উচ্চারণের গতি সুনির্দিষ্টভাবে ঠিক করতে পারেন।

  4. 4

    অডিও তৈরি করুন

    ক্লিক করুন উত্‍পাদন এবং MeloTTS আপনার কথা বাস্তব সময়ে সংশ্লেষিত করবে। কারণ এটি সিপিইউ-তে দক্ষভাবে চলছে, ফলাফল দ্রুত আসে এমনকি দীর্ঘ পাসওয়ার্ডের জন্যও, এবং কাজের খরচ প্রতি ১০০০ অক্ষর ১০ ক্রেডিট।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    ফলাফলটি পুনরায় চালিয়ে দেখুন, তারপর ইতিহাস পৃষ্ঠা থেকে আপনার পছন্দের ফরম্যাটে অডিও ফাইলটি ডাউনলোড করুন। আপনার নিজের অ্যাপলিকেশনে MeloTTS স্বয়ংক্রিয় করতে, আপনার অ্যাকাউন্টের API টোকেন ব্যবহার করে api.texttospeechai.com-এ TextToSpeechAI REST API কল করুন।

মেলো- টিটিএস অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "মেলোটিটিএস বিশ্বের বিভিন্ন দেশের স্বতন্ত্র উচ্চারণ ব্যবহার করে স্বাভাবিকভাবে কথা বলে।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

MeloTTS একটি দ্রুত টেক্সট-টু-স্পীচ মডেল যা মাইশেল AI থেকে মাল্টি-অক্ষর উচ্চারণ উচ্চারণ সংশ্লেষণে বিশেষজ্ঞ। এটি ইংরেজি ভাষার জন্য বেশ কয়েকটি উচ্চারণ বৈচিত্র্য সহ একাধিক ভাষা সমর্থন করে, বাস্তব-সময়ের গতিতে প্রাকৃতিক প্রসোডি উৎপাদন করে।

হ্যাঁ, MeloTTS MIT লাইসেন্সের অধীনে প্রকাশিত হয়েছে, কোড এবং মডেল উভয়ই এর অন্তর্ভুক্ত। আপনি এটি বাণিজ্যিক পণ্য হিসেবে মুক্তভাবে ব্যবহার করতে পারেন, কোন রয়্যাল্টি বা অনুমোদন ব্যতীত।

MeloTTS আমেরিকান, ব্রিটিশ, ভারতীয় এবং অস্ট্রেলিয়ান ইংরেজি উচ্চারণ সমর্থন করে। এটি স্প্যানিশ, ফরাসি, চীনা, জাপানি এবং কোরিয়ান ভাষার জন্য স্বদেশী শব্দও অন্তর্ভুক্ত করে, যা এটিকে আন্তর্জাতিক অ্যাপ্লিকেশনের জন্য উপযুক্ত করে তোলে।

MeloTTS ছয়টি ভাষা সমর্থন করে: ইংরেজি, স্প্যানিশ, ফরাসি, চীনা, জাপানি এবং কোরীয়। ইংরেজি শব্দগুলো মূল ভাষার উপরে আঞ্চলিক উচ্চারণ যোগ করে, তাই একক মডেল অনেক বাজারকে সামলাতে পারে।

হ্যাঁ। MeloTTS বাস্তব সময়ের সংশ্লেষণের জন্য ডিজাইন করা হয়েছে এবং সিপিইউ-তে প্লেব্যাকের চেয়েও দ্রুততরভাবে কথা বলার সৃষ্টি করে। এটি লাইভ ভয়েস অ্যাসিস্ট্যান্ট, চ্যাটবট এবং স্ট্রিমিং অ্যাপ্লিকেশনের জন্য একটি শক্তিশালী ফিট করে।

MeloTTS সুন্দর, প্রাকৃতিক-স্বরযুক্ত কথা বলার জন্য পরিষ্কার প্রসোদ এবং সঠিক উচ্চারণ ব্যবহার করে। এটি ধীর গতির মডেল যেমন StyleTTS2 বা Tortoise এর তুলনায় গতি এবং উচ্চারণ বৈচিত্র্যকে অগ্রাধিকার দেয়, তাই এটি সবচেয়ে গুরুত্বপূর্ণ যখন প্রতিক্রিয়াশীলতা সবচেয়ে গুরুত্বপূর্ণ।

না, MeloTTS কণ্ঠস্বর ক্লোন করে না। এটি পূর্বনির্ধারিত স্পিকার এবং উচ্চারণ ব্যবহার করে। TextToSpeechAI-এ কণ্ঠস্বর ক্লোন করার জন্য, এর পরিবর্তে F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, অথবা Tortoise ব্যবহার করুন।

কোন GPU প্রয়োজন নেই। MeloTTS সিপিইউ-তে ৫০০ মেগাবাইট মেমরি ব্যবহার করে সঠিকভাবে চলবে এবং বাস্তব সময়ে চলবে। একটি GPU বৈকল্পিক এবং শুধুমাত্র অতিরিক্ত গতি যোগ করবে; যদি আপনি একটি ব্যবহার করতে চান তবে ৫০০ মেগাবাইট VRAM যথেষ্ট হবে।

MeloTTS is a standard-tier engine on TextToSpeechAI, billed at 10 credits per 1,000 characters. That is the lowest pricing tier, matching other lightweight CPU models like Piper, VITS, and Kokoro.

Both MeloTTS and Kokoro are fast, MIT/Apache-licensed CPU models at the standard credit tier. Choose MeloTTS when you need distinct English accents (American, British, Indian, Australian); choose Kokoro for its broad multilingual voice variety. Both are easy to A/B test on TextToSpeechAI.

MeloTTS উচ্চারণ বৈচিত্র্য এবং বহুভাষিক কভারেজে অসাধারণ, যখন পাইপার সর্ববৃহৎ প্রাক-নির্ধারিত শব্দ লাইব্রেরী প্রদান করে। উভয়ই দ্রুত এবং সিপিইউ-সক্ষম প্রমিত স্তরে, তাই উচ্চারণ-বিশেষ প্রকল্পের জন্য MeloTTS এবং পাইপার বেছে নিন যখন আপনি সর্ববৃহৎ বিচিত্র শব্দের নির্বাচন চান।

Yes. New TextToSpeechAI accounts include free starter credits, and there is a demo you can use without signing up. That is enough to test MeloTTS accents and voices before buying additional credits or subscribing.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try মেলো- টিটিএস Now

Generate your first audio free. No credit card required.

Start Free