Кокороpuertorico. kgm

Standard

Блискавка- швидкий, легкий TTS з природною якістю

Very Fast Швидкість
Good Якість
Ні Клонування
9 Мови

Про програму Кокороpuertorico. kgm

Kokro - це ультралегка модель 82М параметр TTS, яка надає можливість синтезу мовлення з природи з неймовірною швидкістю. Вона працює майже у режимі реального часу навіть у процесорі, що робить її ідеальною для програм, які не мають значення для програми, де є критична застарівання. Kokro підтримує декілька мов і надає можливість змішування голосів.

Можливості ключів

Ultra- Lightа safe

Параметри 82M, розмір моделі ~300MБ. Виконує процесор з мінімальними ресурсами.

Близько реального часу

Створює мову швидше за швидкість відтворення, навіть без прискорення GPU.

Багаторядковий

Підтримує англійську, французьку, іспанську, хінді, японську, китайську, італійську, португальську та корейську мови.

Змішування голосів

Змішайте два голоси, щоб створити унікальні голосові комбінації.

Випадки використання

Тайм-боти і віртуальні помічники Текст для потокового тексту Використання ребер та мобільні програми Пакетна обробка з високими вольми

Як користуватися Кокороpuertorico. kgm

  1. 1

    Виписатися безкоштовно або спробувати демонстрацію

    Створіть вільний обліковий запис TextToSpeechAI для отримання 200 кредитів на початку або скористайтеся демонстрацією без підпису, щоб почути Kokro. Стандартний інструмент гри означає, що Kokoro коштує лише 10 кредитів на 1000 символів.

  2. 2

    Виберіть голос Кокороро

    Відкрийте переглядач голосів і оберіть голос Kokro у вашій мові (9), який підтримується англійською, японською та корейською мовами). Крім того, ви можете скористатися голосом Kokro, який змішується, щоб змішати два голоси з нетиповою комбінацією.

  3. 3

    Введіть ваш текст

    Введіть або вставте текст, який ви бажаєте почути у редактор. Kokro ефективно керує довгими проходами, дякуючи його легкому 82М- параметру, що знаходиться поряд з рушієм реального часу.

  4. 4

    Скоригувати швидкість і створити

    Встановіть швидкість відтворення у значення для вашого випадку використання, а потім натисніть кнопку Створити. Kkoro передає звук швидше за реальний час, отже, ви майже негайно зможете розпочати мовлення.

  5. 5

    Звантажити або скористатися API

    Звантажити завершений аудіо як MP3 або WAV або автозавершене створення за допомогою TextToSpeechAI SEST API за адресою api. texttoSpeechai.com для пакетного та реального часу завантаження.

Кокороpuertorico. kgm API

Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Кокоро дає природну мову з неймовірною швидкістю і ефективністю.",
    "voice": "en_US-lessac-medium"
  }'

Часті запитання

Kokro - це ультралегка модель тексту, яка має лише 82 мільйони параметрів. Незважаючи на малий розмір, вона створює мову, яка звучить природно, на багатьох мовах, майже на швидкості реального часу, навіть у процесорі.

Так, Kokro має повну ліцензію на Apache 2. 0 - код і модель ваги. Ним можна вільно користуватися у комерційних програмах без обмежень.

Кокоро підтримує англійську (США і Британію), французьку, іспанську, хінді, японську, китайську, італійську, португальську та корейську мови.

Kokroo є однією з найшвидкісніших моделей TTS. Вона створює мовлення швидше, ніж реальна швидкість відтворення, навіть у процесорі, роблячи її ідеальною для інтерактивних програм.

Ні, Kokro не підтримує клонування голосів. У програмі використовується випічена бібліотека голосів з можливостями змішування голосів. Для клонування голосів скористайтеся F5- TTS, Chatterbox, StyleTTS2, OpenGous або Tortois.

Kokro може змішати два голоси, щоб створити унікальні комбінації. Таким чином ви зможете створювати власні характеристики голосу без традиційного клонування голосу.

Обидва варіанти є швидкими, легкими. У Kokoro є більш сучасна архітектура і підтримує змішування голосів, а у Piper - більша бібліотека голосових. Обидва вони чудово пасують до програм у режимі реального часу.

Kokro розроблено для запуску процесора і потребує мінімальних ресурсів - приблизно 300 Мб. Для роботи програми не потрібен процесор, хоча прискорення GPU підтримується ще для пришвидшення обробки.

Так. Kokro створює мовлення швидше за відтворення навіть у процесорі, з дуже низькою пізною швидкістю, отже, він чудово пасує до chatbots, апаратів голосових повідомлень і до інших потоків. Розміри пам' яті 82M- parameter роблять його дуже маленьким, оскільки він є практичним для високовольтних і меж.

За допомогою змішування голосів ви можете змішати два голоси Kokroro, щоб створити унікальну комбінацію з нетиповими характеристиками. Це не традиційне клонування голосів, - ви не можете відтворити певну особу з зразка, - але це надасть вам більше різноманітності, ніж фіксована бібліотека голосів. Ви можете експериментувати з змішуванням безпосередньо у редакторі TextToSpeechAI.

Обидва ці рушії є швидкими, дружніми до ЦП рушіями стандартних рушіїв без клонування голосів. Kokro є найсвітлішим (близько 300MB) і підтримує змішування голосів з 9 мовами, а MloTTS фокусується на багатьох англійських акцентах і виводах, що виводяться у реальному часі. Виберіть Kokro для найменшого сліду і змішування; виберіть MloTTS, якщо вам потрібні специфічні акценти.

Kokro - це стандартний рушій- tier, який коштує 10 кредитів на 1000 символів - найнижчий елемент з TextToSpeechAI. Нові рахунки отримують 200 вільних кредитів, отже ви можете спробувати Kokro без сплати. Таким чином, ви можете створити високоякісну мову на шкалі.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Кокороpuertorico. kgm Now

Generate your first audio free. No credit card required.

Start Free