مناطق

Ultra

شبیه‌سازی صدای بیانگر با کنترل احساسات و سبک

Medium سرعت
Excellent کیفیت
آره شبیه‌سازی
5 زبانها

در مورد مناطق

s.

ویژگیهای کلیدی

کنترل احساسات

احساسات کنترلی عبارتند از: شادی، غم، خشم، ترس، تعجب، نفرت و خنثی.

شبیه‌سازی صدا

هر صدایی را از ۵ تا ۳۰ ثانیه صدای مرجع با صدایی با کیفیت بالا کپی کنید.

سخنرانی بیانی

پارامترهای ۱٫۶B، سخنرانی بسیار بیانگر با انتقال احساسات ظریف را تولید می‌کنند.

چندزبانه

از زبان‌های انگلیسی، ژاپنی، چینی، فرانسوی و آلمانی پشتیبانی می‌کند.

موارد استفاده

ایجاد محتوای بیانی احساسی صداهای شخصیت بازی با احساسات گویندگی کتاب صوتی با حالت تجربه‌های صدای تعاملی

چطور استفاده شود مناطق

  1. 1

    ثبت نام یا باز کردن نمایش

    Create a free TextToSpeechAI account to get starter credits, or use the no-signup demo to try Zonos right away.

  2. 2

    انتخاب موتور Zonos

    از گزینش‌کننده صدا و مدل، Zonos را انتخاب کنید. برای شبیه‌سازی یک صدا، ۵ تا ۳۰ ثانیه از صدای مرجع تمیز را بارگذاری کنید تا Zonos بتواند با بلندگو تطابق پیدا کند.

  3. 3

    وارد کردن متن

    متنی را که می‌خواهید به زبان انگلیسی خوانده شود را تایپ یا بچسبانید. Zonos در زبان‌های انگلیسی، ژاپنی، چینی، فرانسوی و آلمانی کار می‌کند.

  4. 4

    يه احساس رو انتخاب کن و توليد کن

    یکی از هفت احساس زونو را انتخاب کنید - خنثی، شادی، غم، خشم، ترس، تعجب یا نفرت - سپس روی تولید کلیک کنید تا سخنرانی بیانی را در آن حالت ایجاد کنید.

  5. 5

    دانلود یا استفاده از API

    پخش و دانلود صدای نهایی، یا فراخوانی همان موتور زونوس به صورت برنامه‌نویسی از طریق REST API TextToSpeechAI برای جریان‌های کاری خودکار.

مناطق API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ژانرهای ادبی با توجه به نگرش‌های خاصی که به بیان احساسات می‌پردازند، تعریف می‌شوند.",
    "voice": "en_US-lessac-medium"
  }'

پرسشهای متداول

Zonos is a 1.6B parameter text-to-speech model from Zyphra. It specializes in expressive speech generation with fine-grained emotion control and high-fidelity voice cloning. On TextToSpeechAI it runs as an ultra-tier engine for the most nuanced, emotionally rich audio.

بله. زونوس تحت مجوز آپاچی ۲٫۰ برای کد و وزن مدل منتشر می‌شود، بنابراین می‌تواند به صورت آزاد در محصولات تجاری بدون هیچ محدودیتی غیر تجاری استفاده شود. این باعث می‌شود که برای برنامه‌های پرداختی، کارهای مشتری و محتوای پولساز ایمن باشد.

زونوس هفت حالت احساسی را که قبل از تولید انتخاب می‌کنید ، آشکار می‌کند — خنثی ، خوشحالی ، غم ، خشم ، ترس ، تعجب و نفرت. مدل ، انتقال آن را بر اساس احساس انتخاب شده ، تغییر طنین ، سرعت و نغمه ، به شرطی که همان جمله می‌تواند شاد یا خشمگین به نظر برسد ، تنظیم می‌کند. این ، زونوس را برای صداهای شخصیت و گفتگوهایی که به یک حالت خاص نیاز دارند ، ایده‌آل می‌کند.

زونوس از هفت گزینه احساس پشتیبانی می‌کند: خنثی، خوشحالی، غم، خشم، ترس، تعجب و نفرت. شما برای تنظیم رنگ احساسی کل ویدئو، در هر نسل یک گزینه را انتخاب می‌کنید.

بله. زونوس صدایی را از ۵۰ تا ۳۰ ثانیه صدای مرجع کپی می‌کند، ویژگی‌های سخنران را استخراج می‌کند و آنها را در گفتار جدید بازتولید می‌کند. شما می‌توانید کپی را با هر یک از هفت احساس ترکیب کنید تا صدای کپی شده خوشحال، عصبانی یا ترسیده به نظر برسد.

زونوس پنج زبان را پشتیبانی می‌کند: انگلیسی، ژاپنی، چینی، فرانسوی و آلمانی. کنترل احساسات و شبیه‌سازی صدا در تمام این زبان‌ها کار می‌کند.

زونوس به دلیل اندازه پارامترهای ۱٫۶ بیتی با سرعت متوسط اجرا می‌شود، با تبادل کارایی خام برای خروجی عالی و بسیار بیانگر. کیفیت در میان بهترین‌ها برای گفتار احساسی و شبیه سازی شده است، بنابراین به جای تولید صوتی نهایی به جای تولید انبوه در زمان واقعی مناسب است.

Zonos requires 8GB or more of VRAM for its 1.6B parameter model. A GPU with at least 10GB is recommended for comfortable operation when combining voice cloning with emotion control. On TextToSpeechAI all of this runs on our GPU backend, so you need no hardware of your own.

زونوس یک موتور فوق‌طبقه است که با ۵۰ کرید در هر ۱۰۰۰ کاراکتر محاسبه می‌شود.طبقه فوق‌طبقه مدل بزرگ و توانایی‌های پیشرفته احساس و شبیه‌سازی را منعکس می‌کند، همانند StyleTTS2، Tortoise و OpenVoice.

هر دو ، کنترل سبک و احساس را با شبیه‌سازی صدا ارائه می‌دهند. Zonos هفت حالت احساس جداگانه و یک معماری مدرن ۱٫۶B را فراهم می‌کند ، در حالی که OpenVoice سبک‌های صدایی مانند دوستانه ، شاد و زمزمه کردن را با شبیه‌سازی فوری بسیار سریع ارائه می‌دهد. Zonos را هنگامی که می‌خواهید انتخاب واضح احساس و حداکثر بیان را بخواهید انتخاب کنید. OpenVoice را برای تغییر سبک تر و سریعتر صدا انتخاب کنید.

Bark نشانگرهای بیانی مانند [خنده] و [خندی] را اضافه می‌کند اما شبیه‌سازی محدودی را ارائه می‌دهد ، و Dia بر روی گفتگوی چندگوینده با صداهای غیرکلامی تمرکز دارد. Zonos بر روی انتخاب احساس صریح به علاوه شبیه‌سازی قوی تک‌صدای تمرکز دارد ، که به شما کنترل دقیقی بر روی حال و هوای هر کلیپ می‌دهد. موتوری را انتخاب کنید که با نیاز شما مطابقت دارد ، چه برچسب‌های احساسی ، چرخش‌های گفتگو ، یا احساسات قابل انتخاب نیاز داشته باشید.

بله. حساب هاي جديد TextToSpeechAI اعتبار شروع مجاني مي گيرند و نمايشگاه به شما اجازه مي دهد بدون ثبت نام نمونه هاي صوتي توليد کنيد. اين براي تست کنترل احساسات زونوس و شبيه سازي صدا قبل از خريد اعتبارات اضافي کافي است.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try مناطق Now

Generate your first audio free. No credit card required.

Start Free