گفتار-TTS

Premium

تولید صدای توصیف‌شده متنی

Moderate سرعت
Very Good کیفیت
نه شبیه‌سازی
1 زبانها

در مورد گفتار-TTS

voices based on the text descriptions you specify.

ویژگیهای کلیدی

توصیفهای متنی

صداها را با توصیف ویژگی‌های مورد نظر تولید کنید.

کنترل خلاقانه

سن، جنسیت، لهجه، سرعت و سبک صحبت کردن را مشخص کنید.

صداهای منحصربه‌فرد

این کتابخانه‌ها در کتابخانه‌های پیش‌فرض موجود نیستند.

خروجی طبیعی

صدای طبیعی و با کیفیت بالا تولید می‌کند.

کارآمد

تابعی که برای توصیف تابعی که تابعی را توصیف می‌کند استفاده می‌شود.

متن باز

آپاچی ۲٫۰ برای استفاده تجاری مجوز داده شده‌است.

موارد استفاده

طراحی صدای کاراکتر پروژه‌های خلاقانه نمونه توسعه بازیName نویسه‌های کتاب صوتی ایجاد صدای سفارشی

گفتار-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

چطور استفاده شود گفتار-TTS

  1. 1

    ثبت نام رایگان یا آزمایش نمایشی

    Create a free TextToSpeechAI account for 200 starter credits, or open the demo to try Parler-TTS instantly without signing up.

  2. 2

    Parler-TTS را انتخاب کنید و شرح صدا را بنویسید

    Parler-TTS را به عنوان موتور خود انتخاب کنید، سپس یک توصیف صوتی متنی ساده مانند "یک زن جوان با لهجه آمریکایی واضح صحبت می‌کند" بنویسید.

  3. 3

    متنی که باید خوانده شود را وارد کنید

    متنی را که می‌خواهید به صورت گفتاری خوانده شود ، تایپ یا بچسبانید. Parler- TTS این متن را به صورت صدایی که توسط توصیف شما تعریف شده ، نمایش می‌دهد ، بنابراین توصیف و متن را به همان زبان نگه دارید) انگلیسی بهترین کار را می‌کند (.

  4. 4

    تولید گفتار

    برای ارسال کار به پشته GPU ما روی تولید کلیک کنید. Parler-TTS صدای طبیعی را ترکیب می‌کند که با صدای توصیف شده شما مطابقت دارد، که در سطح پریمیوم ۲۵ کرون در هر ۱۰۰۰ کاراکتر محاسبه می‌شود.

  5. 5

    بارگیری یا فراخوانی API

    فایل صوتی نهایی را به صورت MP3، WAV یا OGG دانلود کنید، یا تولید خودکار را از طریق API TextToSpeechAI با گذراندن متن و توصیف صوتی ذخیره شده در هر درخواست انجام دهید.

گفتار-TTS API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "یک زن جوان خوشحال با لهجه آمریکایی صحبت می‌کند.",
    "voice": "parler-female_american"
  }'

پرسشهای متداول

Parler-TTS یک مدل تبدیل متن به گفتار است که صداها را از توضیحات متنی تولید می‌کند. به جای انتخاب صداهای از پیش ساخته شده، شما آنچه را که می‌خواهید توصیف می‌کنید: «یک زن آرام و بالغ با لهجه استرالیایی که با سرعت متوسط صحبت می‌کند.»

Parler-TTS is open-source under Apache 2.0 license. On TextToSpeechAI, we charge 25 credits per 1000 characters (Premium tier) for its unique voice generation capabilities.

Parler-TTS در درجه اول از انگلیسی پشتیبانی می‌کند. توصیف‌های صوتی به بهترین شکل در انگلیسی کار می‌کنند، اگرچه مدل می‌تواند لهجه‌های انگلیسی مختلف (آمریکایی، بریتانیایی، استرالیایی و غیره) را مدیریت کند.

ویژگی‌های صدا را به صورت طبیعی توصیف کنید: «یک زن جوان با لهجه انگلیسی صحبت می‌کند» یا «یک مرد مسن با صدای عمیق آهسته و با دقت صحبت می‌کند.»

Parler-TTS سرعت تولید متوسطی دارد، معمولاً ۲ تا ۵ ثانیه در هر جمله در GPU.

نه ، Parler-TTS صداها را از توصیفات تولید می‌کند ، نه از شبیه‌سازی صداهای موجود. برای شبیه‌سازی صدا ، از StyleTTS2 ، F5-TTS ، OpenVoice یا Tortoise استفاده کنید.

Parler-TTS نیازمند ۴-۸ گیگابایت از VRAM است که بسته به اندازه مدل متفاوت است. نسخه مینی با ۴ گیگابایت کار می‌کند، در حالی که مدل کامل از ۸ گیگابایت برای عملکرد بهینه استفاده می‌کند.

بله ، Parler- TTS دارای مجوز آپاچی ۲٫ ۰ است و از استفاده تجاری پشتیبانی می‌کند. از آنجایی که صداها از توصیفات تولید می‌شوند ، هیچ نگرانی مالکیت صدا وجود ندارد.

توصیف صدای خود را در درخواست API همراه با متن خود شامل کنید. API ما توصیف را پردازش می‌کند و گفتار تطابقی تولید می‌کند. می‌توانید توصیف‌های مورد علاقه را برای استفاده مجدد ذخیره کنید.

Parler-TTS produces very good, natural-sounding audio with prosody that matches your described voice. It outputs WAV natively, and on TextToSpeechAI you can download it as MP3, WAV, or OGG with automatic conversion.

هر دو موتورهای متن باز و بیانگر هستند ، اما در کنترل تفاوت دارند. Parler- TTS به شما اجازه می‌دهد که صدا را با یک توصیف متنی ساده (سن ، لهجه ، سرعت ، حال و هوا) هدایت کنید ، در حالی که Bark نشانه‌های غیرکلامی مانند [خنده] و موسیقی را اضافه می‌کند. Parler- TTS را هنگامی که یک صدای توصیف شده خاص را می‌خواهید انتخاب کنید و Bark را هنگامی که می‌خواهید احساسات خودبه‌خودی را منتقل کنید.

Yes. Sign up for a free account on TextToSpeechAI to receive 200 starter credits, or use the demo to hear Parler-TTS without an account. That is enough to test several voice descriptions before choosing a credit pack.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try گفتار-TTS Now

Generate your first audio free. No credit card required.

Start Free