Kokoro

Standard

Blesk-rýchly, ľahký TTS s prirodzenou kvalitou.

Very Fast Rýchlosť
Good Kvalita
Nie Klonovanie
9 Jazyky

O nás Kokoro

[Translation temporarily unavailable. Please try again.]

Kľúčové vlastnosti produktu

Ultra ľahká váha

82M parametrov, ~300MB veľkosť modelu. Beží na CPU s minimálnymi zdrojmi.

Takmer v reálnom čase

Generuje reč rýchlejšie ako rýchlosť prehrávania, a to aj bez akcelerácie GPU.

Multi-jazykové rozhranie

Podporuje angličtinu, francúzštinu, španielčinu, hindčinu, japončinu, čínštinu, taliančinu, portugalčinu a kórejčinu.

Hlasové miešanie

Zmiešajte dva hlasy dohromady a vytvorte jedinečné kombinácie hlasov.

Prípady použitia

Chatboty a virtuálni asistenti v reálnom čase Živé streamovanie text-to-speech Edge nasadenie a mobilné aplikácie Vysokoobjemové dávkové spracovanie

Ako používať Kokoro

  1. 1

    Zaregistrujte sa zdarma alebo vyskúšajte demo

    Vytvorte si bezplatný TextToSpeechAI účet a získajte 200 kreditov, alebo použite demo bez registrácie a počúvajte Kokoro okamžite.Štandardná úroveň znamená, že Kokoro stojí len 10 kreditov za 1000 znakov.

  2. 2

    Vyberte si Kokoro hlas

    Otvorte prehliadač hlasov a vyberte hlas Kokoro v cieľovom jazyku (podporovaných je 9 jazykov, od angličtiny po japončinu a kórejčinu).Môžete tiež použiť zlučovanie hlasu Kokoro na zmiešanie dvoch hlasov do vlastnej kombinácie.

  3. 3

    Zadajte svoj text

    Kokoro zvláda dlhé pasáže efektívne vďaka svojmu ľahkému 82M-parametru, ktorý je takmer v reálnom čase, a tiež vďaka tomu, že je schopný čítať texty v reálnom čase.

  4. 4

    Nastavte rýchlosť a generovať

    Nastavte rýchlosť prehrávania podľa vášho prípadu použitia a potom kliknite na tlačidlo Generovať.Kokoro renderuje zvuk rýchlejšie ako v reálnom čase, takže vaša reč je pripravená takmer okamžite.

  5. 5

    Stiahnite si alebo použite API

    Stiahnite si hotový zvuk ako MP3 alebo WAV, alebo automatizovať generovanie prostredníctvom TextToSpeechAI REST API na api.texttospeechai.com pre dávkové a real-time pracovné zaťaženie.

Kokoro API

Generujte reč programovo pomocou rozhrania REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro prináša prirodzenú reč s neuveriteľnou rýchlosťou a účinnosťou.",
    "voice": "en_US-lessac-medium"
  }'

Často kladené otázky

Kokoro je ultraľahký model premeny textu na reč s iba 82 miliónmi parametrov, ktorý napriek svojej malej veľkosti produkuje prirodzene znejúcu reč v niekoľkých jazykoch rýchlosťou takmer v reálnom čase, dokonca aj na CPU.

Áno, Kokoro je plne licencované Apache 2.0 - kód aj modelové váhy - a môže byť voľne použité v komerčných aplikáciách bez obmedzenia.

Kokoro podporuje angličtinu (USA a Británia), francúzštinu, španielčinu, hindčinu, japončinu, čínštinu, taliančinu, portugalčinu a kórejčinu.

Kokoro je jedným z najrýchlejších dostupných modelov TTS, ktorý generuje reč rýchlejšie ako rýchlosť prehrávania v reálnom čase aj na CPU, čo ho robí ideálnym pre interaktívne aplikácie.

Nie, Kokoro nepodporuje klonovanie hlasu, používa knižnicu hlasových knižníc s možnosťou zmiešania hlasu. Na klonovanie hlasu použite F5-TTS, Chatterbox, StyleTTS2, OpenVoice alebo Tortoise.

Kokoro dokáže zmiešať dva hlasy a vytvoriť tak jedinečné kombinácie, čo vám umožní vytvoriť vlastné charakteristiky hlasu bez tradičného klonovania hlasu.

Obidva modely sú rýchle a ľahké. Kokoro má modernejšiu architektúru a podporuje mixovanie hlasu, zatiaľ čo Piper má väčšiu hlasovú knižnicu, a obidva sú vynikajúce pre aplikácie v reálnom čase.

Kokoro je navrhnutý tak, aby bežal na CPU a vyžaduje minimálne zdroje - približne 300 MB, nie je potrebný žiadny GPU, aj keď je podporovaná akcelerácia GPU pre ešte rýchlejšie spracovanie.

Kokoro generuje reč rýchlejšie ako prehrávanie aj na CPU, s veľmi nízkou latenciou, takže je vynikajúcim riešením pre chatboty, hlasových asistentov a živé vysielanie. Jeho veľkosť parametra 82M udržuje malé využitie pamäte, čo je praktické pre veľké objemy a nasadenie na hraniciach.

Voice blending umožňuje zmiešať dva hlasy Kokoro dohromady a vytvoriť tak jedinečnú kombináciu s vlastnými charakteristikami. Nie je to tradičné klonovanie hlasu - nemôžete reprodukovať konkrétnu osobu zo vzorky - ale poskytuje vám viac variácie ako pevná hlasová knižnica. Môžete experimentovať s miešaním priamo v editore TextToSpeechAI.

Obidva sú rýchle, CPU-friendly štandardné motory bez klonovania hlasu. Kokoro je najľahší (asi 300 MB) a podporuje hlasové miešanie v 9 jazykoch, zatiaľ čo MeloTTS sa zameriava na viac anglických prízvukov a viacjazyčný výstup v reálnom čase. Vyberte Kokoro pre najmenšiu stopu a miešanie; vyberte MeloTTS, keď potrebujete špecifické prízvuky.

Kokoro je štandardný engine, ktorý stojí 10 kreditov za 1000 znakov - najnižšia úroveň na TextToSpeechAI. Noví používatelia dostanú 200 kreditov zadarmo, takže si môžete vyskúšať Kokoro bez platenia, čo z neho robí jeden z najlacnejších spôsobov generovania vysoko kvalitnej reči v rozsahu.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokoro Now

Generate your first audio free. No credit card required.

Start Free