Piper TTS

Standard

Швидке, невагомне синтезування тексту

Very Fast Швидкість
Good Якість
Ні Клонування
20 Мови

Про програму Piper TTS

Piper - це швидка, локальна система синтезу мовлення з тексту, оптимізована для Raspberry Pi та інших країв. Для роботи з ним використовують моделі, засновані на VITS, які пройшли навчання на високоякісних записах голосів, що надсилаються з мінімальними можливостями обчислення. Piper є найкращим для програм, які потребують синтезу мовлення у режимі реального часу без залежності від хмар.

Можливості ключів

Ультра- піковий синтезатор

Створює мовлення у режимі реального часу, навіть на низько потужних пристроях, на зразок Распбері Пі.

Оптимізований ЦП

Ефективно виконується на процесорі без потреби у дорогому обладнанні процесора.

20+ Мови

Підтримка вимови мови, що налічувала понад 20 мов.

Поза мережею

Працює повністю без з' єднання з мережею, не потрібного для з' єднання з мережею.

Privacy- first

Всі процеси відбуваються локально - ваш текст ніколи не залишає вашого пристрою.

Відкрити джерело

Повністю відкритий код у ліцензії MIT з активною спільнотою.

Випадки використання

Кмітливі помічники домівки Програми доступності Телефонні системи IVR Вбудовані пристрої Освітня програма Поза мережею програм

Piper TTS Voices

View All 101
Alan (Fast) (UK English)
EN_GB
Alan (UK English)
EN_GB
Alba (UK English)
EN_GB
Alejandro (Spanish (Mexico))
ES_MX
Amir (Persian)
FA_IR
Amy (Fast) (US English)
EN_US
Amy (US English)
EN
Anders (Danish)
DA_DK
Anna (Hungarian)
HU_HU
Arctic (US English)
EN_US
Arthur (UK English)
EN_GB
Artur (Slovenian)
SL_SI

Як користуватися Piper TTS

  1. 1

    Розписатися безкоштовно або відкрити демонстрацію

    Створіть вільний обліковий запис TextToSpeechAI для отримання початкових кредитів або скористайтеся демонстрацією на сторінці для того, щоб негайно спробувати Piper без підписування.

  2. 2

    Виберіть голос Piper

    Відкрийте бібліотеку і фільтр голосу за допомогою рушія Piper, а потім перегляньте голоси, які знаходяться на вашій мові і акценті, щоб знайти правильну.

  3. 3

    Ввести або вставити ваш текст

    Введіть або вставте скрипт, який ви бажаєте почути, до поля для введення тексту. Piper добре керує розділовими записами і довшими уривками, отже, ви можете перемістити всі абзаци.

  4. 4

    Скоригувати швидкість і створити

    Встановіть швидкість мовлення (приблизно 0, 5x у 2. 0x) у відповідності до вашого проекту, а потім натисніть кнопку " Створити," щоб Piper синтезував звук у секундах на процесорі.

  5. 5

    Звантажити аудіо або викликати API

    Звантажте ваш кліп як MP3, WAV або OGG з панелі результатів або надішліть цей же звук до точки кінця / v1/generate/ REST.

Piper TTS API

Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Ласкаво просимо до Piper, швидкого і легкого нейронного рушія синтезу мовлення.",
    "voice": "en_GB-alan-low"
  }'

Часті запитання

Piper - це швидкий, легкий нейронний рушій для синтезу мовлення з тексту, який перетворює текст на мову, що відтворюється на натуральну, засновану на відео, моделі VITS, оптимізовані для ефективного визначення процесора, що робить Piper ідеальним для пристроїв ребер, автономних інструментів і програм, які можуть працювати у режимі реального часу. Ви можете спробувати Piper без обмежень на TextToSpeechAI у вашому переглядачі.

Так, Piper є повністю вільним і відкритим джерелом за ліцензією MIT, отже, ви можете використовувати його для особистих та комерційних проектів без плат за ліцензування. За TextToSpeechAI ви можете спробувати Piper безкоштовно з вашими початковими кредитами, і продовжувати використовувати лише 10 кредитів на 1000 символів.

Так, Piper випущено за умовами доступності до ліцензій MIT, яка надає вам змогу користуватися комерційною системою. Ви можете доставити дані Piper у комерційні продукти, відео, програми і служби без сплати за сім' ї або додавання їх до сховища.

У Пайпері понад 20 мов, зокрема англійська (США, Великобританія та інші акценти), іспанська, французька, німецька, італійська, португальська, голландська, польська, російська та багато інших. Кожна з мов постачається з декількох попередньо підготовлених голосів " Piper," з яких можна вибирати у бібліотеці голосів TextToSpeechAI.

Piper є одним з найшвидших рушіїв TTS, які працюють зручно у процесорі. Він може синтезувати мовлення у режимі реального часу навіть на Raspberry Pi, отже TextToSpeechAI більшість Piper надсилає запити на повернення звукових даних за секунду.

Ні, Piper не підтримує клонування голосів - він використовує лише попередньо підготовлені голосові моделі. Якщо вам потрібно клонувати певний голос з зразка, скористайтеся рушієм клонування, на зразок F5- TTS або Chatterbox на TextToSpeechAI.

Piper створює ясний, якісний звук, який добре підходить для допоміжних, систем IVR, для опису і доступності інструментів. Він не такий вже й гнучкий, як повільна внескова модель, але його співвідношення швидкості до якості є чудовим для більшості випадків щоденного використання.

Не потрібен процесор - Piper розроблено для запуску процесора і використовує лише декілька сотень мегабайтів пам' яті. Ось чому Piper є дуже придатним для автономних і вбудованих сценаріїв, де не буде призначеної версії GPU.

Так, Piper було створено для швидкого локального визначення і запущено повністю поза мережею після завантаження голосових моделей, без потреби у з' єднанні з мережею. Його невеликий слід і лише ЦП робить Piper одним з найкращих варіантів мовлення з автономного та налаштованого пристрою.

Як у Пайпера, так і у Кокоро є швидкими, дружніми до процесора, стандартними рушіями, де голос не клонується. У Piper дуже велика багатомовна бібліотека голосів і дуже легка, у той час як Kokro часто звучить дотику більш відшліфовано, отже, обирайте Piper для широти голосів і мінімальних ресурсів, а Kokro, якщо вам потрібен типовий голос.

Piper є стандартним прив' язувачем ціноутворення, який коштує 10 кредитів на 1000 символів - найнижчий ключ на TextToSpeechAI. Нові рахунки отримують безкоштовні кредити, отже, ви можете перевірити Piper за будь- яку ціну перед виконанням роботи.

Виберіть голос Piper з бібліотеки голосів, а потім передайте його голос до / v1/generate/ endpoint з вашим жетоном API. REST API виконує відтворення звукового інтерфейсу і повертає адресу URL звантаження, ви можете надіслати запит на вивід MP3, WAV або OGG.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 20
  • GPU VRAM 500MB
  • Credits/1000 chars 10

Try Piper TTS Now

Generate your first audio free. No credit card required.

Start Free