Кокоро

Standard

Быстрый молний, легкий ТТТ с естественным качеством

Very Fast Скорость
Good Качество
Нет Клонирование
9 Знание языков

О том, что Кокоро

Kokoro — модель с очень легким 82M параметром TTS, которая дает естественный звук речи с невероятной скоростью. Она работает в режиме реального времени даже на процессоре, что делает ее идеальной для приложений, где низкая латентность является критической. Kokoro поддерживает множество языков и предлагает возможности для комбинирования голосов.

Основные характеристики

Ультра-Лайтвес

Параметры 82М, размер модели ~300Мб, запускается на процессор с минимальными ресурсами.

Почти в реальном масштабе времени

Создаёт речь быстрее, чем скорость воспроизведения, даже без ускорения GPU.

Многоязычный

Поддерживает английский, испанский, испанский, хинди, японский, китайский, итальянский, португальский и корейский языки.

Скручивание голоса

Смешать два голоса, чтобы создать уникальные комбинации голосов.

Использовать

В реальном масштабе времени болтовни и виртуальные помощники Прямое трансляцию текстового сообщения в режим " спич " Развертывание и мобильные приложения Обработка партии с большим объемом

Как пользоваться Кокоро

  1. 1

    Подпишитесь бесплатно или попробуйте демо

    Создать бесплатный TextToSpeechAI аккаунт для получения 200 стартер-кредитов или использовать невыписку для мгновенного выслушивания Kokooro. Стандартный уровень означает, что Kokoro стоит только 10 кредитов на 1000 знаков.

  2. 2

    Выбери голос Кокоро

    Откройте голосовой браузер и выберите голос Кокоро на вашем языке (9 при поддержке, от английского до японского и корейского). Вы также можете использовать голос Кокоро, чтобы смешивать два голоса в обычную комбинацию.

  3. 3

    Введите ваш текст

    Введите или вставьте текст, на который вы хотите поговорить с редактором. Kokoro эффективно управляет длинными переходами благодаря своему легкому 82м-параметру, почти в режиме реального времени.

  4. 4

    Регулировать скорость и генерировать

    Наберите скорость воспроизведения, чтобы подобрать вариант использования, затем нажмите на Генерацию. Кокоро делает звук быстрее, чем в реальном времени, так что ваша речь почти готова.

  5. 5

    Загрузка или использование API

    Загрузить заключённый аудио как MP3 или WAV, или автоматизировать поколение через TextToSpeechAI REST API на api.textospechai.com для пакетных и в реальном времени.

Кокоро API

Создать речь программно используя TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Кокоро произносит естественную речь с невероятной скоростью и эффективностью.",
    "voice": "en_US-lessac-medium"
  }'

Часто задаваемые вопросы

Kokoro — модель с сверхлегким весом между буквами и пиками, имеющая только 82 миллиона параметров. Несмотря на свой маленький размер, она производит естественный звук речи на нескольких языках с частотой почти в реальном времени, даже на процессоре.

Да, Кокоро полностью лицензирован, как код, так и модель, и может свободно использоваться в коммерческих целях без каких-либо ограничений.

Кокоро поддерживает английский (США и Великобритании), французский, испанский, хинди, японский, китайский, итальянский, португальский и корейский языки.

Кокоро — одна из самых быстрых моделей TTS. Она генерирует речь быстрее, чем в реальном времени, даже на процессоре, что делает ее идеальной для интерактивных приложений.

Нет, Кокоро не поддерживает клонирование голоса. Он использует кухонную голосовую библиотеку с возможностями для смешения голоса. Для клонирования голоса, используйте F5-TTS, Chatterbox, StyleTTS2, OpenVoice, или Tortoise.

Кокоро может смешать два голоса, чтобы создать уникальные комбинации. Это позволяет создавать традиционные характеристики голоса без традиционного клонирования голоса.

У Кокоро есть более современная архитектура и поддерживает смешение голосов, а у Пайпера есть большая голосовая библиотека. Оба они отличные для приложений в реальном времени.

Кокоро предназначен для работы на процессоре и требует минимальных ресурсов - приблизительно 300 МВт. Не требуется ГПУ, хотя ускорение ГПС поддерживается для еще более быстрой обработки.

Кокоро произносит речь быстрее, чем воспроизведение даже на процессоре, с очень низкой запозданием, так что она отлично подходит для чатботов, голосовых помощников и прямого потока. 82М-параметрный размер сохраняет память, используя ее крошечно, что делает ее практичной для развертывания больших объемов и кромок.

Голос смешивает два голоса Кокоро, чтобы создать уникальную комбинацию с характеристиками, присущими обычаям. Это не традиционное клонирование голоса - вы не можете воспроизвести конкретного человека из выборки, - но это дает вам больше разнообразия, чем фиксированная голосовая библиотека. Вы можете экспериментировать с смеси непосредственно в TextToSpeechAI редакторе.

Оба эти двигателя являются быстродействующими, удобными для CPU двигателями стандартного уровня без клонирования голоса. Кокоро - самый легкий (около 300 МВт) и поддерживает голосовую смесь на 9 языках, в то время как MeloTTS фокусируется на нескольких английских акцентах и многоязычных выпусках в реальном времени. Выберите Kokooro для наименьшего отпечатка и смешивания; выберите MeloTTS, когда вам нужен конкретный акцент.

Kokoro — это двигатель стандартного уровня, стоящий 10 кредитов на 1000 знаков - самый низкий уровень на TextToSpeechAI. Новые счета получают 200 бесплатных кредитов, поэтому вы можете попробовать Kokoro без оплаты. Это делает его одним из наиболее эффективных с точки зрения затрат способов подготовки высококачественной речи в масштабе.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Кокоро Now

Generate your first audio free. No credit card required.

Start Free