پوست

Premium

سخنرانی هوش مصنوعی بیانگر با احساسات و جلوه‌های صوتی

Slow سرعت
Very Good کیفیت
نه شبیه‌سازی
13 زبانها

در مورد پوست

s of speech that are not heard by humans. Bark is a

ویژگیهای کلیدی

بیان احساسات

صدای خنده، گریه، گریه کردن و گاهی گریه کردن.

نشانگرهای احساسات

از [خنده] استفاده کن، [تنها]، حروف بزرگ براي تاکید، و... براي ترديد.

چندزبانه

این زبان دارای ۱۳ حرف و تلفظ و لهجه است.

موسیقی و جلوه‌های آن

می‌تواند موسیقی ساده و صداهای محیطی را تولید کند.

تنظیمات پیش‌فرض بلندگو

تعدادی از خوانندگان با سبک‌های مختلف به این سبک می‌پردازند.

متن باز

این نرم‌افزار دارای مجوز MIT با تمام حقوق تجاری است.

موارد استفاده

محاورۀ نویسه محتوای پویانمایی گویندگی کتاب صوتی بازی صدا پروژه‌های خلاقانه کمک‌کننده‌های بیانی

پوست Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

چطور استفاده شود پوست

  1. 1

    ثبت نام رایگان و باز کردن نمایش

    Create a free TextToSpeechAI account to claim your starter credits, or use the no-signup demo to try Bark right away. Free credits are enough to generate several expressive Bark clips before you upgrade.

  2. 2

    صدای هشدار را انتخاب کنید

    کتابخانه صدا را باز کنید و یک پیش‌فرض بلندگوهای Bark را که با صدایی که می‌خواهید مطابقت دارد ، انتخاب کنید. صداهای Bark به عنوان سطح بالا برچسب‌گذاری می‌شوند (۲۵ کرون در هر ۱۰۰۰ کاراکتر) و برای راوی‌سازی احساسی ، به سبک شخصیت تنظیم می‌شوند.

  3. 3

    وارد کردن متن با نشانگرهای احساسی

    دست‌نوشتۀ خود را تایپ کنید و نشانگرهای احساس Bark را در خط جاسازی کنید: [خنده] برای خنده ، [خنده] برای آه کشیدن ، [خنده] برای نفس کشیدن ،... برای توقف ، و CAPS برای تأکید. برای مثال: « اوه وای! [خنده] این شگفت‌انگیز است... باورم نمی‌شود!»

  4. 4

    تولید صدا

    کلیک بر روی تولید و Bark ، متن شما را به گفتار بیانی تبدیل می‌کند ، هر نشانگر را به صدای تطابقی تبدیل می‌کند. به دلیل مدل تبدیل Bark ، تولید کندتر از موتورهای سبک است ، بنابراین برای هر جمله چند ثانیه اضافه اجازه دهید.

  5. 5

    دانلود یا استفاده از API

    پیش‌نمایش نتیجه، سپس دانلود آن به عنوان MP3، WAV، یا OGG. برای خودکارسازی Bark در برنامه خود، API TextToSpeechAI را با صدای Bark و همان متن غنی از نشانگر برای بازگرداندن صدای بیانی فراخوانی کنید.

پوست API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "اوه واو! اين خارق العاده است... من عاشق اينم که چقدر اين به نظر تعبيري مياد!",
    "voice": "bark-zh_0"
  }'

پرسشهای متداول

Bark یک مدل متن به صدا بر پایهٔ تبدیل‌کننده است که توسط Suno ایجاد شده‌است. برخلاف سیستم‌های سنتی TTS، Bark سخنرانی بسیار بیانگر با احساسات طبیعی، خنده، ناله و دیگر صداهای غیرکلامی را تولید می‌کند. حتی می‌تواند موسیقی و جلوه‌های صوتی را تولید کند.

Yes, Bark is open-source under the MIT license, allowing free commercial use. On TextToSpeechAI, we charge 25 credits per 1000 characters due to the significant GPU resources required for generation.

Bark از ۱۳ زبان پشتیبانی می‌کند که شامل انگلیسی، آلمانی، اسپانیایی، فرانسوی، هندی، ایتالیایی، ژاپنی، کره‌ای، لهستانی، پرتغالی، روسی، ترکی و چینی است.

Bark به دلیل معماری تبدیل خودبازگشتی خود، نسبت به بیشتر موتورهای TTS کندتر است. تولید یک جمله معمولی ۵ تا ۱۵ ثانیه در GPU طول می‌کشد. خروجی به طور قابل توجهی بیانگرتر و طبیعی‌تر است.

Bark offers only limited voice cloning through "semantic prompts" and speaker presets, so it cannot reliably clone an arbitrary voice from a sample. If full voice cloning is your goal, use F5-TTS, StyleTTS2, OpenVoice, or Tortoise instead, all available on TextToSpeechAI.

Bark نشانگرهای خطی را که مستقیماً در متن شما قرار داده شده است ، می‌خواند و آنها را به صداهای تطابقی تبدیل می‌کند. از [خنده] برای خنده ، [خنده] برای نفس کشیدن ، [نفس کشیدن] برای نفس کشیدن ،... برای تردید یا توقف ، و CAPS برای تأکید استفاده کنید. مثال: « اوه وای! [خنده] این شگفت‌انگیز است... باورم نمی‌شود! »

در کنار گفتار ساده، Bark می‌تواند صداهای غیرکلامی مانند خنده، نفس کشیدن، نفس کشیدن، گلو پاک کردن، و لکنت، به علاوه موسیقی ساده و اثرات محیطی را تولید کند.اینها با نشانگرهایی مانند [خنده]، [نفس کشیدن] و [لغزش] در متن ایجاد می‌شوند، که باعث می‌شود Bark احساس بیشتری نسبت به TTS استاندارد داشته باشد.

Bark صدای با کیفیت بسیار خوبی با بیان طبیعی تولید می‌کند که برای محتوای احساسی با گفتار انسان رقابت می‌کند. خروجی ۲۴ کیلوهرتز حرفه‌ای به نظر می‌رسد، اگرچه کیفیت گفتار خالص کمی پایین‌تر از StyleTTS2 است.

Bark نیازمند ۸-۱۲ گیگابایت VRAM است که بسته به اندازه مدل متفاوت است. مدل کامل نیازمند ~۱۲ گیگابایت است، در حالی که انواع کوچکتر با ۸ گیگابایت کار می‌کنند.

Yes, Bark is MIT licensed, which permits unrestricted commercial use with no licensing fees. You can use Bark in products, services, and applications freely. On TextToSpeechAI you can try Bark free using your signup credits before paying for more.

Bark excels at expressive single-speaker speech with emotion markers like [laughter] and [sighs], while Dia is built for multi-speaker dialogue with [S1]/[S2] turns and nonverbal cues. Choose Bark for emotional narration and character voice, and Dia for back-and-forth conversations. Both are available on TextToSpeechAI.

Bark در توانایی تولید گفتار واقعی با احساسات و صداهای غیرکلامی منحصر به فرد است. از موتورهای دیگر کندتر است ، اما نتایج شبیه انسان را برای محتوای خلاقانه تولید می‌کند. برای ترکیب سریعتر ، از Piper استفاده کنید. برای شبیه‌سازی صدا ، از F5- TTS یا OpenVoice استفاده کنید.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try پوست Now

Generate your first audio free. No credit card required.

Start Free