Кишеньковий TTS

Standard

Ультралегке клонування голосів, яке працює у режимі реального часу при процесорі

Very Fast Швидкість
Good Якість
Так Клонування
2 Мови

Про програму Кишеньковий TTS

Pocketooth TTS від Kyutai - це надлегка модель параметра 100M для синтезу мовлення з тексту, яка працює у режимі реального часу на процесорі. Незважаючи на його маленький розмір, він підтримує клонування голосу всього за 5 секунд від еталонного звуку. Досконалий для декорації меж, мобільних програм та сценаріїв, де ресурси GPU обмежені. У поточній версії передбачено підтримку англійської та французької.

Можливості ключів

Ultra- Lightа safe

Параметри 100M - працює на процесорі у режимі реального часу з мінімальними ресурсами.

Клинування голосу

Клонувати будь-який голос лише з 5 секунд від звукового запису, навіть на процесорі.

Реальний час на процесорі

Не потрібен GPU. Створює мовлення на швидкості реального часу на стандартному обладнанні.

Edge- Ready

Достатньо мало для мобільних пристроїв, " Распберія " та " вбудованої " системи.

Випадки використання

Краї і мобільні телефони Співпраця з голосами у режимі реального часу у процесорі Вбудовані пристрої IoT Складання малокодованого голосу

Як користуватися Кишеньковий TTS

  1. 1

    Виписатися безкоштовно або спробувати демонстрацію

    Створіть вільний обліковий запис TextToSpeechAI для отримання кредитів на початку або скористайтеся демонстрацією на диску для того, щоб почути Pocket TTS перед тим, як підписатися. Не потрібно GPU або локального встановлення.

  2. 2

    Виберіть кишеньковий TTS і додайте голос для клонування

    Скористайтеся пунктом Pocketar TTS як вашим рушієм, а потім вивантажуйте короткий уривок з 5- 10 секунд, щоб клонувати цей голос. Pocketar TTS працює повністю на процесорі, отже клонування є швидким і легким.

  3. 3

    Введіть ваш текст

    Введіть або вставте вимовлений текст англійською або французькою. Слідкуйте за кількістю символів, оскільки рахунки за кишеньковими записами мають стандартну кількість кредитів на 1000 символів.

  4. 4

    Створити звуковий файл

    Натисніть кнопку " Створити " і Pocket TTS синтезує ваш текст у клонованому голосі з реальною швидкістю. Більшість кліпів готові у секундах, оскільки модель є такою малою і ефективних процесорів.

  5. 5

    Звантажити або скористатися API

    Звантажте завершений звуковий або автозавершений процес створення за допомогою TextToSpeechAI програм API MEST на api. texttoSessai. com за допомогою вашого ключа облікового запису. У API ви можете бачити однаковий код і синтез тексту для ваших власних програм.

Кишеньковий TTS API

Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Кишеньковий TTS передає клонування голосів, що виконується у режимі реального часу, навіть у процесорі.",
    "voice": "en_US-lessac-medium"
  }'

Часті запитання

Pocketoott TTS - це ультралегка модель для синтезу мовлення з тексту з Kyutai з лише 100 мільйонами параметрів. Вона працює у режимі реального часу на процесорі і підтримує клонування голосу з 5 секунд звуку.

Pocketoott TTS має ліцензію у CC-BY- 4. 0, що дозволяє комерційне використання з надсиланням. Вам слід надати кредит Kyutai, якщо ви використовуєте його у комерційних програмах.

Зараз кишеньковий пристрій TTS підтримує англійську і французьку мови. У наступних випусках можна додати більше мов.

Так! За допомогою лише 100M параметрів Pocketooth TTS працює на реальній швидкості на стандартному процесорному апараті. Не потрібен GPU, що робить його ідеальним для використання ребер і мобільних програм.

Обидва варіанти є легкими і добре працюють у процесорі. Pocketle TTS унікально підтримує клонування голосів (Kokoro не підтримує). Kokro підтримує більше мов (9 проти 2). Оберіть Pocket TTS, якщо вам потрібне легке клонування, Kokro, якщо вам потрібно більше опрацювати мову.

Надайте п' ять секунд звукової інформації. Pocketock TTS виділяє характеристики мови і може створювати нові мовлення у цьому голосі. Якість покращується з довшими посиланнями (до 10 секунд).

Так. На відміну від більшості моделей клонування, які потребують GPU, TTS, Pocketle виконує клонування на рівні 0- кадрового голосу повністю за допомогою ЦП завдяки його крихітному відбитку 100M- parameter. Ви можете клонувати голос з короткого кліпу навіть на ноутбуку або однобічним комп' ютером.

Pocketoot TTS випущено за допомогою CC- BY- 4. 0, отже, вам слід надати належне Kyutai як початковому творцеві, коли ви використовуєте його, або повторно його поширювати. Простий внесок, такий як " Голос, створений за допомогою Pocket TTS через Kyutai," задовольняє ліцензію як для комерційного, так і некомерційного використання.

Програма Pocketooth TTS створює мовлення у режимі реального часу або швидше у стандартному процесорі, без потреби у GPU. Це робить його одним з найвідчутливіших рушіїв для випадків низької чутливості, зокрема створення голосових апаратів і пристроїв.

Кишеньковий TTS є стандартним прив' язувачем ціноутворення, який коштує 10 кредитів на 1000 символів. Це робить його одним з найдешевших параметрів для голосування, доступних на TextToSpeechAI.

Обидва ці рушії є легкими, дружніми до процесора, стандартними рушіями. Виберіть Pocketooth TTS, якщо вам потрібно клонувати голос, оскільки Kokoro не підтримує його. Виберіть Kokro, якщо вам потрібно збільшити обкладинку мови, і не потрібно клонувати певний голос.

Так. Нові TextToSpeechAI облікових записів отримують вільні кредити, а демонстрація з врахуванням даних надає вам змогу почути Pocketoottom TTS перед виконанням. Підписуватися безкоштовно, вивантажити короткий довідник і створити текст у секундах.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Кишеньковий TTS Now

Generate your first audio free. No credit card required.

Start Free