صدای باز

Ultra

شبیه‌سازی فوری صدا با کنترل نت‌های دانه دار

Moderate سرعت
Very Good کیفیت
آره شبیه‌سازی
10 زبانها

در مورد صدای باز

of the voice and apply it to the speaking style. OpenVoice is a powerful voice clone model that allows you to clone a voice and apply different tones - cheerful, sad, angry, excited, or whispering - without new reference audio. Unlike other cloning models, OpenVoice separates voice identity from speaking style, allowing you to take a look at the

ویژگیهای کلیدی

شبیه‌سازی فوری

هر صدایی را از چند ثانیه صدا کپی کنید.

کنترل رنگ

غمگین، عصبانی، هیجان زده، یا زمزمه کردن.

انتقال سبک

این روش از روش‌های جداسازی صدا برای رمزگشایی استفاده می‌کند.

زبان‌شناسی

از صداهای کلون شده در زبان‌های مختلف استفاده کنید.

پردازش سریع

خروجی خروجی برای تولید صدای سریع.

متن باز

این نرم‌افزار برای کاربردهای تجاری طراحی شده‌است.

موارد استفاده

محتوای احساسی پویانمایی کاراکتر بازیهای تعاملیName گویندگی کتاب صوتی ویدئوی بازاریابی دستیار مجازی

چطور استفاده شود صدای باز

  1. 1

    ثبت نام رایگان یا آزمایش نمایشی

    Create a free TextToSpeechAI account to get starter credits, or use the on-page demo to hear OpenVoice before committing. No local GPU or install is needed - everything runs on our servers.

  2. 2

    انتخاب OpenVoice و بارگذاری یک کلیپ مرجع

    موتور OpenVoice را انتخاب کنید ، سپس چند ثانیه از صدای مرجع تمیز را برای شبیه‌سازی فوری صدای هدف بارگذاری کنید. OpenVoice هویت سخنران را ضبط می‌کند ، بنابراین می‌توانید آن را در هر متن و صدای دیگری استفاده کنید.

  3. 3

    وارد کردن متن

    متنی را که می‌خواهید در صدای شبیه‌سازی شده گفته شود تایپ یا بچسبانید. OpenVoice از حدود ۱۰ زبان و ارائهٔ چندزبانه پشتیبانی می‌کند، بنابراین می‌توانید به زبان دیگری نسبت به ویدئو مرجع بنویسید.

  4. 4

    انتخاب سبک و تولید

    یکی از نه سبک صدای OpenVoice را انتخاب کنید — پیش‌فرض ، دوست‌داشتنی ، شاد ، هیجان‌زده ، غمگین ، عصبانی ، ترسیده ، فریاد زدن یا زمزمه کردن — سپس تولید کنید. همان صدای شبیه سازی شده با آن انتقال احساسی صحبت خواهد کرد.

  5. 5

    دانلود یا استفاده از API

    صوت خود را به صورت MP3، WAV یا OGG دانلود کنید، یا تولید خودکار را از طریق TextToSpeechAI API با انتقال صدای شبیه سازی شده و سبک صدا در هر درخواست انجام دهید.

صدای باز API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "اوپن‌وایسک می‌تواند با هر صدایی صحبت کند: شاد، غمگین یا حتی زمزمه.",
    "voice": "en_US-lessac-medium"
  }'

پرسشهای متداول

OpenVoice یک مدل پیشرفته متن به گفتار و شبیه‌سازی صدا است که هویت صدا را از سبک گفتار جدا می‌کند. این به شما اجازه می‌دهد که یک صدا را شبیه‌سازی کنید و سپس بدون نیاز به صدای مرجع جدید برای هر احساس ، نت‌های احساسی مختلف را اعمال کنید. این برای تولید گفتار قابل کنترل و بیان ساخته شده است.

بله ، OpenVoice شبیه‌سازی فوری صدا را از چند ثانیه صدای مرجع انجام می‌دهد — نیازی به اجرای آموزشی نیست. هنگامی که صدا ضبط شد ، OpenVoice می‌تواند از آن هویت در هر متن و هر سبک صدایی که انتخاب می‌کنید استفاده کند.

OpenVoice از یک معماری دو مرحله‌ای استفاده می‌کند که ترکیب گفتار پایه را از تبدیل به صدا جدا می‌کند. پس از شبیه‌سازی یک صدا ، می‌توانید هر یک از ۹ سبک صدا را اعمال کنید — پیش‌فرض ، دوستی ، شاد ، هیجان ، غمگین ، عصبانی ، ترس ، فریاد زدن یا زمزمه کردن — و همان صدای شبیه‌سازی شده بر اساس صدای انتخاب شده شما بدون ضبط مجدد متفاوت صحبت می‌کند.

اوپن‌وییس از نه سبک گفتار پشتیبانی می‌کند: پیش‌فرض، دوستانه، شاد، هیجان‌زده، غمگین، عصبانی، ترسیده، فریاد زدن و زمزمه کردن. هر سبکی انتقال احساسات را با حفظ هویت سخنران شبیه سازی شده، کنترل دقیقی بر نحوه خواندن یک خط را به شما می‌دهد.

OpenVoice یک منبع باز تحت مجوز MIT است ، بنابراین برای استفاده تجاری رایگان است. همانند هر مدل شبیه‌سازی ، مطمئن شوید که حقوق مناسبی برای هر صدایی که برای پروژه‌های تجاری شبیه‌سازی می‌کنید دارید.

اوپن‌ویچ از حدود ۱۰ زبان پشتیبانی می‌کند که شامل انگلیسی، چینی، ژاپنی، کره‌ای و چندین زبان اروپایی می‌شود.این نرم‌افزار همچنین امکان شبیه‌سازی چندزبانه را نیز فراهم می‌کند، بنابراین می‌توانید صدایی را در یک زبان شبیه‌سازی کرده و به صورت طبیعی در زبان دیگر صحبت کنید.

کیفیت خروجی بسیار خوب است، با بازتولید واضح صدا و انتقال نت که هویت سخنران را سالم نگه می‌دارد در حالی که به طور قانع‌کننده انتقال احساسات را تغییر می‌دهد.

OpenVoice typically requires 6-8GB of VRAM depending on batch size and tone conversion load. It runs comfortably on mid-range to upper mid-range GPUs, and on TextToSpeechAI all of this is handled on our servers so you do not need any local hardware.

اوپن‌وییس یک موتور اولترا-تیر است که قیمت آن ۵۰ کرید در هر ۱۰۰۰ کاراکتر است. سطح اولترا بازتاب کنترل پیشرفتهٔ صدا و محاسبات اضافی مورد نیاز برای شبیه‌سازی و خط لوله تبدیل سبک را دارد.

OpenVoice برای کنترل صدا و سبک منحصر به فرد است: می‌توانید یک صدای شبیه‌سازی شده را بگیرید و آن را به صورت شاد، غمگین، عصبانی یا زمزمه کننده دوباره ارائه دهید. F5- TTS سریع‌تر است و موتور شبیه‌سازی پیش‌فرض ما برای گفتار طبیعی و خنثی است. OpenVoice را هنگامی که به کنترل سبک احساسی نیاز دارید ، و F5- TTS را هنگامی که سریع‌ترین شبیه سازی طبیعی را می‌خواهید ، انتخاب کنید.

با بارگذاری صدای مرجع ، یک صدای شبیه سازی شده ایجاد کنید ، سپس یک سبک صدا را در درخواست API خود مشخص کنید. API به طور خودکار صدای احساسی انتخاب شده را به صدای شبیه سازی شده اعمال می‌کند و صدا را به صورت MP3 ، WAV یا OGG برمی‌گرداند.

Yes. Sign up for a free TextToSpeechAI account to receive starter credits and try OpenVoice cloning and tone control, or use the on-page demo first. There is no local setup - upload a reference clip, pick a tone, and generate in the browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try صدای باز Now

Generate your first audio free. No credit card required.

Start Free