Кокоро

Standard

Бърза светкавица, лека TTS с естествено качество

Very Fast Скорост
Good Качество
Не. Клониране
9 Езици

За Кокоро

Кокоро е ултра лек 82M параметър TTS модел, който осигурява естествено звукова реч с невероятна скорост. Тя работи близо до реално време дори и при CPU, което го прави идеален за приложения, където ниската латентност е критична. Kokoro поддържа множество езици и предлага възможности за сливане на глас.

Ключови характеристики

Ултра леко

82M параметри, ~300MB размера на модела. Изпълнява процесора с минимални ресурси.

Близо до реално време

Генерира реч по-бързо от скоростта на възпроизвеждане, дори и без ускорение на GPU.

Многоезичен

Подкрепя английски, френски, испански, хинди, японски, китайски, италиански, португалски и корейски.

Гласово смесване

Разбъркайте два гласа заедно, за да създадете уникални гласови комбинации.

Случаи за използване

Реално време чатботове и виртуални асистентки Излъчване на текст в живо Разпоредба на ръба и мобилни приложения Обработка на партидна партида с висок обем

Как да използвате Кокоро

  1. 1

    Запишете се безплатно или опитайте демото

    Създайте безплатен TextToSpeechAI акаунт, за да получите 200 стартер кредити, или да използвате демо без регистрация, за да чуете Kokoro незабавно. Стандартният ниво означава, че Kokoro струва само 10 кредита на 1000 символа.

  2. 2

    Избери кокоро глас.

    Отворете гласовия браузър и изберете кокоро глас на вашия език (9 подкрепени, от английски на японски и корейски). Също така можете да използвате Кокоро глас смесване, за да смесвате два гласа в поръчка комбинация.

  3. 3

    Въведете вашия текст

    Въведете или вметнете текста, който искате да говорите в редактора. Kokoro се справя с дълги пасажи ефективно благодарение на лекия 82M-параметър, близо до двигателя в реално време.

  4. 4

    Настройване на скоростта и генериране

    Настройте скоростта на възпроизвеждането, за да подхожда на вашия случай за използване, след което кликнете върху Генериране. Kokoro излъчва звук по-бързо от реалното време, така че речта ви е готова почти незабавно.

  5. 5

    Изтеглете или използвайте API

    Изтеглете завършения звук като MP3 или WAV, или автоматизирайте поколение чрез TextToSpeechAI REST API в api.texttospeechai.com за партидни и реално време натоварване.

Кокоро API

Генерирайте речна програма с помощта на TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Кокоро носи естествена реч с невероятна скорост и ефективност.",
    "voice": "en_US-lessac-medium"
  }'

Често задавани въпроси

Кокоро е ултра лек текст-то-спеех модел с само 82 милиона параметри. Въпреки малкия си размер, той произвежда естествено-звучна реч в много езици с почти реално време скорост, дори и при процесора.

Да, Kokoro е напълно Apache 2.0 лицензирани - както код, така и модел тежести. Тя може да се използва свободно в търговски приложения без ограничения.

Кокоро поддържа английски (щати и британски), френски, испански, хинди, японски, китайски, италиански, португалски и корейски.

Кокоро е един от най-бързите налични модели на TTS. Той генерира реч по-бързо от скоростта на възпроизвеждане в реално време дори и на CPU, което го прави идеален за интерактивни приложения.

Не, Kokoro не поддържа клониране на гласа. Използва курирана гласова библиотека с възможности за комбиниране на гласа. За клониране на гласа, използвайте F5-TTS, Chatterbox, StyleTTS2, OpenVoice или Tortoise.

Кокоро може да смеси два гласа заедно, за да създаде уникални комбинации. Това ви позволява да създадете обичайни гласови характеристики без традиционно клониране на гласа.

И двете са бързи, леки модели. Кокоро има по-модерна архитектура и поддържа гласова смесване, докато Piper има по-голяма гласова библиотека. И двете са отлични за реално време приложения.

Kokoro е проектиран да работи на CPU и изисква минимални ресурси - приблизително 300MB. Не се нуждае GPU, въпреки че GPU ускорение е подкрепено за още по-бърза обработка.

Да. Кокоро генерира реч по-бързо от възпроизвеждането дори и на процесора, с много ниска латентност, така че е отлично подходящ за чатботи, гласови асистентки и на живо стрийминг. Нейният размер 82M-параметър държи паметта използват мъничко, което го прави практично за високо обемни и ръбови разгръщания.

Гласовото смесване ви позволява да смесите два гласа Kokoro заедно, за да създадете уникална комбинация с свойствени характеристики. Това не е традиционно клониране на гласа - не можете да възпроизведете определен човек от проба - но това ви дава повече разнообразие от фиксирана гласова библиотека. Можете да експериментирате с смеси директно в TextToSpeechAI редактор.

И двете са бързи, приятни за процесор стандартни двигатели без клониране на глас. Kokoro е най-лекият (около 300MB) и поддържа глас, който се смесва на 9 езика, докато MeloTTS се фокусира върху множество английски акценти и в реално време многоезичен изход. Изберете Kokoro за най-малкия отпечатък и смесване; изберете MelotTS, когато се нуждаете от конкретни акценти.

Кокоро е стандартен двигател, който струва 10 кредита на 1000 символа - най-ниската степен на TextToSpeechAI. Новите сметки получават 200 безплатни кредита, така че можете да опитате Kokoro без плащане. Това го прави един от най-рентабилните начини за генериране на висококачествено говорене в мащаба.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Кокоро Now

Generate your first audio free. No credit card required.

Start Free