صدای آهنگ

Standard

TTS چند لهجه‌ای سریع با نظم طبیعی

Very Fast سرعت
Good کیفیت
نه شبیه‌سازی
6 زبانها

در مورد صدای آهنگ

MeloTTS is a fast, multi-accent text-to-speech model from MyShell AI. It supports multiple languages with authentic accent variations for English (American, British, Indian, Australian). MeloTTS runs at real-time speed on CPU, making it efficient for production deployments.

ویژگیهای کلیدی

لهجۀ چندگانه

زبان انگلیسی دارای لهجه‌های متعددی است: آمریکایی، بریتانیایی، هندی و استرالیایی.

CPU زمان واقعی

به اندازه کافی سریع برای سنتز زمان واقعی بر روی CPU بدون GPU.

زبانها

از زبان‌های انگلیسی، اسپانیایی، فرانسوی، چینی، ژاپنی و کره‌ای پشتیبانی می‌کند.

کنترل سرعت

سرعت خروجی برای خروجی تنظیم شده.

موارد استفاده

برنامه‌های کاربردی صدای چند لهجهName محل‌یابی محتوای بین‌المللی دستیارهای صوتی زمان واقعی تولید کتاب صوتی با تنوع لهجه

چطور استفاده شود صدای آهنگ

  1. 1

    ثبت نام رایگان یا آزمایش نمایشی

    Create a free TextToSpeechAI account to receive starter credits, or use the no-signup demo on the homepage to test MeloTTS instantly. Free credits are enough to evaluate several MeloTTS accents before you commit.

  2. 2

    برگزیدن لهجه و صدای MeloTTS

    باز کردن مرورگر صدا و فیلتر کردن به MeloTTS. لهجه ای را که با شنوندگان شما سازگار است ، مانند انگلیسی آمریکایی ، انگلیسی بریتانیایی ، هندی یا استرالیایی ، یا یک صدای بومی اسپانیایی ، فرانسوی ، چینی ، ژاپنی یا کره‌ای را انتخاب کنید.

  3. 3

    وارد کردن متن

    متنی را که می‌خواهید به صورت صوتی در جعبه متنی پخش شود ، تایپ یا بچسبانید. MeloTTS به طور خودکار ، نظم طبیعی را مدیریت می‌کند ، و می‌توانید سرعت گفتار را برای تنظیم دقیق سرعت برای لهجه انتخاب‌شده تنظیم کنید.

  4. 4

    تولید صدا

    کلیک کنید تولید کنید و MeloTTS گفتار شما را در زمان واقعی ترکیب می‌کند. چون به صورت کارآمد در CPU اجرا می‌شود ، نتایج حتی برای گذرگاه‌های طولانی سریعاً برمی‌گردد ، و هزینه کار ۱۰ کرون در هر ۱۰۰۰ کاراکتر است.

  5. 5

    دانلود یا استفاده از API

    نتیجه را پخش کنید، سپس پرونده صوتی را در قالب مورد علاقه خود از صفحه تاریخچه دانلود کنید. برای خودکارسازی MeloTTS در برنامه خود، API REST TextToSpeechAI را در api.texttospeechai.com با استفاده از توکن API حساب خود فراخوانی کنید.

صدای آهنگ API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "زبان مالایایی با لهجه‌های گوناگون در سراسر جهان صحبت می‌شود.",
    "voice": "en_US-lessac-medium"
  }'

پرسشهای متداول

MeloTTS یک مدل سریع متن به گفتار از MyShell AI است که در ترکیب گفتار چند لهجه تخصص دارد. این زبان از چندین زبان با چندین لهجه برای انگلیسی پشتیبانی می‌کند، که تولید صوت طبیعی را در سرعت زمان واقعی انجام می‌دهد.

بله. MeloTTS تحت مجوز MIT منتشر می‌شود ، که هم کد و هم وزن مدل را پوشش می‌دهد. می‌توانید به صورت آزاد از آن در محصولات تجاری بدون نیاز به حق امتیاز یا ذکر منبع استفاده کنید.

MeloTTS از لهجه‌های انگلیسی آمریکایی، بریتانیایی، هندی و استرالیایی پشتیبانی می‌کند. همچنین شامل صداهای بومی برای اسپانیایی، فرانسوی، چینی، ژاپنی و کره‌ای است، که آن را برای برنامه‌های کاربردی بین‌المللی مناسب می‌کند.

MeloTTS شش زبان را پوشش می‌دهد: انگلیسی، اسپانیایی، فرانسوی، چینی، ژاپنی و کره‌ای. صداهای انگلیسی لهجه‌های منطقه‌ای اصیل را بر زبان پایه اضافه می‌کنند، بنابراین یک مدل واحد بازارهای زیادی را مدیریت می‌کند.

بله. MeloTTS برای ترکیب زمان واقعی طراحی شده و حتی در CPU ، سریعتر از پخش ، گفتار تولید می‌کند. این باعث می‌شود که برای کمک‌کننده‌های صدای زنده ، چت‌بات‌ها و برنامه‌های کاربردی جریانی مناسب باشد.

MeloTTS صدای طبیعی و خوب با نظم واضح و لهجه‌های دقیق تولید می‌کند. سرعت و تنوع لهجه را بر وفاداری فوق‌العاده مدل‌های کندتر مانند StyleTTS2 یا Tortoise اولویت می‌دهد، بنابراین ایده‌آل است وقتی پاسخگویی مهم‌ترین مسئله است.

No, MeloTTS does not clone voices. It uses a fixed set of preset speakers and accents. For voice cloning on TextToSpeechAI, use F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, or Tortoise instead.

هیچ GPU مورد نیاز نیست. MeloTTS به راحتی روی CPU با استفاده از حدود ۵۰۰ مگابایت حافظه اجرا می‌شود و در زمان واقعی باقی می‌ماند. یک GPU اختیاری است و فقط سرعت اضافی اضافه می‌کند؛ اگر انتخاب کنید که از آن استفاده کنید، حدود ۵۰۰ مگابایت VRAM کافی است.

MeloTTS is a standard-tier engine on TextToSpeechAI, billed at 10 credits per 1,000 characters. That is the lowest pricing tier, matching other lightweight CPU models like Piper, VITS, and Kokoro.

Both MeloTTS and Kokoro are fast, MIT/Apache-licensed CPU models at the standard credit tier. Choose MeloTTS when you need distinct English accents (American, British, Indian, Australian); choose Kokoro for its broad multilingual voice variety. Both are easy to A/B test on TextToSpeechAI.

MeloTTS در تنوع لهجه و پوشش چندزبانه برتری دارد ، در حالی که Piper بزرگترین کتابخانه صداهای پیش‌فرض را ارائه می‌دهد. هر دو سریع و CPU- capable در سطح استاندارد هستند ، بنابراین MeloTTS را برای پروژه‌های لهجه خاص و Piper را هنگامی که گسترده‌ترین انتخاب از صداهای متمایز را می‌خواهید انتخاب کنید.

Yes. New TextToSpeechAI accounts include free starter credits, and there is a demo you can use without signing up. That is enough to test MeloTTS accents and voices before buying additional credits or subscribing.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try صدای آهنگ Now

Generate your first audio free. No credit card required.

Start Free