Kokoro

Standard

Lightning-rychlé, lehké TTS s přírodní kvalitou

Very Fast Rychlost
Good Kvalita
Ne. Klonování
9 Jazyky

O aplikaci Kokoro

Kokoro je ultralehký 82M parametr TTS model, který přináší přirozeně znějící řeč neuvěřitelnou rychlostí. Běží téměř v reálném čase i na CPU, takže je ideální pro aplikace, kde je nízká latence kritická. Kokoro podporuje více jazyků a nabízí hlasové míchací schopnosti.

Klíčové funkce

Ultralehká hmotnost

82M parametry, ~300MB velikost modelu. Spouští na procesoru s minimálními zdroji.

Blízko reálného času

Generuje řeč rychleji než rychlost přehrávání, i bez zrychlení GPU.

Vícejazyčné

Podporuje angličtinu, francouzštinu, španělštinu, hindštinu, japonštinu, čínštinu, italštinu, portugalštinu a korejštinu.

Míchání hlasu

Smíchejte dva hlasy dohromady a vytvořte jedinečné hlasové kombinace.

Pouzdra na použití

Chatboti a virtuální asistenti v reálném čase Live streaming text-to-speech Zaváděcí hrany a mobilní aplikace Vysokoobjemové zpracování šarží

Jak se používá Kokoro

  1. 1

    Zaregistrujte se zdarma nebo vyzkoušejte demo

    Vytvořit zdarma TextToSpeechAI účet získat 200 starter kreditů, nebo použít demo no-signup slyšet Kokoro okamžitě. Standardní úroveň znamená Kokoro pouze stojí 10 kreditů na 1000 znaků.

  2. 2

    Vyberte si Kokoro hlas

    Otevřete hlasový prohlížeč a vyberte Kokoro hlas ve vašem cílovém jazyce (9 podporováno, z angličtiny do japonštiny a korejštiny). Můžete také použít Kokoro hlasové mixování pro mísení dvou hlasů do vlastní kombinace.

  3. 3

    Zadejte svůj text

    Zadejte nebo vložte text, který chcete do editoru. Kokoro efektivně zpracovává dlouhé pasáže díky svému lehkému 82M-parametru, poblíž motoru v reálném čase.

  4. 4

    Nastavte rychlost a generujte

    Nastavte rychlost přehrávání tak, aby vyhovovala vašemu pouzdru použití, pak klikněte na Generovat. Kokoro vykresluje zvuk rychleji než v reálném čase, takže váš projev je připraven téměř okamžitě.

  5. 5

    Stáhnout nebo použít API

    Stáhněte si hotový zvuk jako MP3 nebo WAV, nebo automatizace generace přes TextToSpeechAI REST API na api.texttospeechai.com pro dávkové a real-time pracovní zatížení.

Kokoro API

Generovat řeč programově pomocí TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro přináší přirozený projev s neuvěřitelnou rychlostí a účinností.",
    "voice": "en_US-lessac-medium"
  }'

Často kladené otázky

Kokoro je ultra-lehký text-to-speech model s pouze 82 milionů parametrů. Navzdory své malé velikosti, to produkuje přirozenou-zpívající řeč v několika jazycích při téměř rychlosti v reálném čase, a to i na CPU.

Ano, Kokoro má plnou licenci Apache 2.0 - jak kód, tak i hmotnost modelu. Lze ji volně používat v komerčních aplikacích bez omezení.

Kokoro podporuje angličtinu (USA a Britové), francouzštinu, španělštinu, hindštinu, japonštinu, čínštinu, italštinu, portugalštinu a korejštinu.

Kokoro je jedním z nejrychlejších modelů TTS, které jsou k dispozici. Vytváří řeč rychleji než rychlost přehrávání v reálném čase i na CPU, takže je ideální pro interaktivní aplikace.

Ne, Kokoro nepodporuje klonování hlasu, používá kurovanou hlasovou knihovnu se schopnostmi mísení hlasu. Pro klonování hlasu použijte F5-TTS, Chatterbox, Styletts2, OpenVoice nebo Tortoise.

Kokoro může smíchat dva hlasy dohromady pro vytvoření jedinečných kombinací. To vám umožní vytvářet vlastní hlasové charakteristiky bez tradičního klonování hlasu.

Oba jsou rychlé, lehké modely. Kokoro má modernější architekturu a podporuje hlasové mixování, zatímco Piper má větší hlasovou knihovnu. Obě jsou vynikající pro aplikace v reálném čase.

Kokoro je navržen tak, aby jezdil na procesoru a vyžaduje minimální zdroje - přibližně 300MB. GPU není potřeba, i když GPU zrychlení je podporováno pro ještě rychlejší zpracování.

Ano. Kokoro vytváří řeč rychleji než přehrávání i na CPU, s velmi nízkou latencí, takže je to výborná volba pro chatboty, hlasové asistenty a živé streaming. Jeho velikost 82M-parametru udržuje paměť používat malé, takže je praktické pro vysoce objemové a hrany nasazení.

Voice mixing umožňuje smíchat dva Kokoro hlasy dohromady vytvořit jedinečnou kombinaci s vlastními vlastnostmi. Není to tradiční hlasové klonování - nemůžete reprodukovat konkrétní osobu ze vzorku - ale dává vám větší rozmanitost než pevná hlasová knihovna. Můžete experimentovat se směsmi přímo v editoru TextToSpeechAI.

Oba jsou rychlé, CPU-přátelské standardní-tier motory bez hlasového klonování. Kokoro je nejlehčí (asi 300MB) a podporuje promíchání hlasu v devíti jazycích, zatímco MeloTTS se zaměřuje na více anglických přízvuků a v reálném čase vícejazyčný výstup. Vyberte Kokoro pro nejmenší stopu a mísení; vyberte MeloTTS, pokud potřebujete konkrétní akcenty.

Kokoro je standardní motor, který stojí 10 kreditů na 1000 znaků - nejnižší úroveň na TextToSpeechAI. Nové účty získat 200 volných kreditů, takže si můžete vyzkoušet Kokoro bez placení. To z něj dělá jeden z nejnákladnějších způsobů, jak generovat vysoce kvalitní řeč v měřítku.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokoro Now

Generate your first audio free. No credit card required.

Start Free