Kapesní TTS

Standard

Ultra-lehké klonování hlasu, které běží v reálném čase na CPU

Very Fast Rychlost
Good Kvalita
Ano. Klonování
2 Jazyky

O aplikaci Kapesní TTS

Kapesní TTS od Kyutai je ultra-lehký 100M parametr text-to-speech model, který běží v reálném čase na CPU. I přes svou malou velikost podporuje klonování hlasu z pouhých 5 sekund referenčního zvuku. Ideální pro nasazení hran, mobilní aplikace, a scénáře, kde jsou zdroje GPU omezené. V současné době podporuje anglicky a francouzsky.

Klíčové funkce

Ultralehká hmotnost

100M parametry - běží v reálném čase na procesoru s minimálními zdroji.

Klonování hlasu

Klonovat jakýkoliv hlas z pouhých 5 sekund referenčního zvuku, dokonce i na CPU.

Skutečný čas na procesoru

Není potřeba GPU. Generuje řeč v reálném čase rychlost na standardní hardware.

Edge-Ready

Dost malé pro mobilní zařízení, Malina Pi, a vložené systémy.

Pouzdra na použití

Nasazení hran a mobilních zařízení Hlasové asistenty v reálném čase na CPU IoT a zabudovaná zařízení Nízkozdrojové klonování hlasu

Jak se používá Kapesní TTS

  1. 1

    Zaregistrujte se zdarma nebo vyzkoušejte demo

    Vytvořte si zdarma TextToSpeechAI účet pro příjem starter kreditů, nebo použijte demo on-site slyšet Pocket TTS před přihlášením. Není zapotřebí GPU nebo místní instalaci.

  2. 2

    Vyberte kapsu TTS a přidejte hlas do klonu

    Vyberte Pocket TTS jako svůj motor, pak nahrát krátký referenční klip asi 5 až 10 sekund klonovat tento hlas. Kapesní TTS běží zcela na procesoru, takže klonování je rychlé a lehké.

  3. 3

    Zadejte svůj text

    Zadejte nebo vložte anglický nebo francouzský text, který chcete mluvit. Dávejte pozor na počet znaků, protože Pocket TTS bankovky se standardní sazbou 10 kreditů na 1000 znaků.

  4. 4

    Generovat zvuk

    Klikněte na tlačítko generovat a Pocket TTS syntetizuje váš text v klonovaném hlase rychlostí v reálném čase. Většina klipů je připravena v sekundách, protože model je tak malý a CPU efektivní.

  5. 5

    Stáhnout nebo použít API

    Stáhněte si hotový zvuk, nebo automatizujte generování přes TextToSpeechAI REST API na api.texttospeechai.com pomocí vašeho účtu token. API odhaluje stejné Pocket TTS klonování a syntéza pro své vlastní aplikace.

Kapesní TTS API

Generovat řeč programově pomocí TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kapesní TTS přináší hlasové klonování, které běží v reálném čase, dokonce i na CPU.",
    "voice": "en_US-lessac-medium"
  }'

Často kladené otázky

Kapesní TTS je ultralehký textový model z Kyutai s pouhými 100 miliony parametrů. Na CPU běží v reálném čase a podporuje hlasové klonování od 5 sekund zvuku.

Kapesní TTS je licencován pod CC-BY-4, což umožňuje komerční použití s přiřazením. Kyutai je třeba při jeho použití v komerčních aplikacích.

V současné době Pocket TTS podporuje angličtinu a francouzštinu. V budoucích verzích mohou být přidány další jazyky.

Ano! S pouze 100M parametry, Kapesní TTS běží v reálném čase rychlostí na standardní CPU hardware. Není zapotřebí GPU, takže je ideální pro nasazení hran a mobilní aplikace.

Oba jsou lehké a běží dobře na procesoru. Kapsa TTS jednoznačně podporuje klonování hlasu (Kokoro ne). Kokoro podporuje více jazyků (9 vs 2). Vyberte kapsu TTS, pokud potřebujete lehký hlas klonování, Kokoro, pokud potřebujete více jazykových pokrytí.

Poskytněte 5 sekund referenčního zvuku. Kapsa TTS extrakty reproduktor vlastnosti a může generovat nový projev v tomto hlase. Kvalita zlepšuje s delšími referencemi (až 10 sekund).

Ano. Na rozdíl od většiny klonovacích modelů, které vyžadují GPU, Kapesní TTS provádí na CPU klonování s nulovým shotem zcela díky své malé stopě 100M-parametru. Můžete naklonovat hlas z krátkého klipu i na notebooku nebo na počítači s jedním prstem.

Kapesní TTS je uvolněn pod CC-BY-4,0, takže musíte připsat Kyutai jako původního tvůrce, když jej používáte nebo přerozdělujete. Jednoduché přiřazení jako "Voice generované s Pocket TTS od Kyutai" splňuje licenci pro komerční i nekomerční použití podobně.

Kapesní TTS generuje řeč v reálném čase nebo rychleji na standardním procesoru, bez nutnosti GPU. To z něj dělá jeden z nejvíce reagujících motorů pro nízkonákladové použití případů, jako jsou živé hlasové asistenty a on-device generace.

Kapesní TTS je ve standardní cenové úrovni, stojí 10 kreditů na 1000 znaků. To z něj dělá jednu z nejhospodárnějších možností hlasového clonění k dispozici na TextToSpeechAI.

Oba jsou lehké, CPU přátelské, standardní motory. Vyberte kapsu TTS, když potřebujete hlasové klonování, protože Kokoro nepodporuje.Vyberte Kokoro, když potřebujete širší jazykové pokrytí a nemusíte klonovat konkrétní hlas.

Ano. Nové TextToSpeechAI účty obdrží zdarma starter kredity, a on-site demo umožňuje slyšet Pocket TTS před odevzdáním. Zaregistrujte se zdarma, nahrát krátký referenční klip, a generovat klonovaný projev v sekundách.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kapesní TTS Now

Generate your first audio free. No credit card required.

Start Free