Zak TTS

Standard

Ultra lichtgewicht stemklonen die real-time op CPU draait

Very Fast Snelheid
Good Kwaliteit
Ja. Klonen
2 Talen

Info Zak TTS

Pocket TTS van Kyutai is een ultralichtgewicht 100M parameter tekst-tot-spraak model dat in real-time draait op CPU. Ondanks zijn kleine grootte, ondersteunt het stemklonen vanaf slechts 5 seconden referentie audio. Perfect voor randimplementatie, mobiele toepassingen, en scenario's waar GPU-bronnen zijn beperkt. Momenteel ondersteunt Engels en Frans.

Belangrijkste kenmerken

Ultralichtgewicht

100M parameters - draait real-time op CPU met minimale middelen.

Stemklonen

Kloon elke stem van slechts 5 seconden referentie audio, zelfs op CPU.

Real-time op CPU

Geen GPU nodig. Genereert spraak met realtime snelheid op standaard hardware.

Rand-klaar

Klein genoeg voor mobiele apparaten, Raspberry Pi, en ingebedde systemen.

Gebruik kasten

Rand en mobiele inzet Real-time stemassistenten op CPU IoT en embedded devices Low-resource stemklonen

Hoe gebruikt u dit middel? Zak TTS

  1. 1

    Gratis aanmelden of probeer de demo

    Maak een gratis TextToSpeechAI-account aan om startercredits te ontvangen, of gebruik de demo op de site om Pocket TTS te horen voordat u zich aanmeldt. Er is geen GPU of lokale installatie nodig.

  2. 2

    Selecteer Pocket TTS en voeg een stem toe aan kloon

    Kies Pocket TTS als uw motor, dan upload een korte referentie clip van ongeveer 5 tot 10 seconden om die stem te klonen. Pocket TTS draait volledig op CPU, dus klonen is snel en lichtgewicht.

  3. 3

    Voer uw tekst in

    Typ of plak de Engelse of Franse tekst die u wilt spreken. Houd een oogje op de karakters tellen, aangezien Pocket TTS rekeningen tegen het standaard tarief van 10 credits per 1000 tekens.

  4. 4

    Het audio-bestand aanmaken

    Klik op genereren en Pocket TTS synthetiseert uw tekst in de gekloonde stem op real-time snelheid. De meeste clips zijn klaar in seconden omdat het model zo klein en CPU-efficiënt is.

  5. 5

    Download of gebruik de API

    Download de voltooide audio, of automatiseer generatie via de TextToSpeechAI REST API op api.texttospeechai.com met behulp van uw account token. De API stelt dezelfde Pocket TTS klonen en synthese voor uw eigen apps bloot.

Zak TTS API

Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS levert stemklonen die in real\u002Dtime draait, zelfs op CPU.",
    "voice": "en_US-lessac-medium"
  }'

Veelgestelde vragen

Pocket TTS is een ultralichtgewicht tekst-tot-spraak model van Kyutai met slechts 100 miljoen parameters. Het draait in real-time op CPU en ondersteunt stemklonen vanaf 5 seconden audio.

Pocket TTS is gelicentieerd onder CC-BY-4.0, die commercieel gebruik met toeschrijving mogelijk maakt. U moet Kyutai crediteren wanneer u het gebruikt in commerciële toepassingen.

Momenteel Pocket TTS ondersteunt Engels en Frans. Meer talen kunnen worden toegevoegd in toekomstige releases.

Ja! Met slechts 100M parameters draait Pocket TTS op real-time snelheid op standaard CPU hardware. Er is geen GPU nodig, waardoor het ideaal is voor randimplementatie en mobiele toepassingen.

Beide zijn lichtgewicht en lopen goed op CPU. Pocket TTS ondersteunt uniek voice cloning (Kokoro niet). Kokoro ondersteunt meer talen (9 vs 2). Kies Pocket TTS als je lichtgewicht voice cloning, Kokoro als je meer taaldekking nodig hebt.

Zorg voor 5 seconden referentie audio. Pocket TTS haalt speaker kenmerken en kan nieuwe spraak in die stem genereren. Kwaliteit verbetert met langere referenties (tot 10 seconden).

Ja. In tegenstelling tot de meeste klonen modellen die een GPU vereisen, Pocket TTS voert nul-shot stem klonen volledig op CPU dankzij zijn kleine 100M-parameter voetafdruk. U kunt een stem klonen vanaf een korte clip, zelfs op een laptop of single-board computer.

Pocket TTS wordt vrijgegeven onder CC-BY-4.0, dus je moet krediet Kyutai als de oorspronkelijke maker wanneer u het gebruikt of herdistribueert. Een eenvoudige toeschrijving zoals "Voice gegenereerd met Pocket TTS door Kyutai" voldoet aan de licentie voor commercieel en niet-commercieel gebruik.

Pocket TTS genereert spraak in real-time of sneller op een standaard CPU, zonder GPU nodig. Dit maakt het een van de meest responsieve motoren voor lage-latency gebruik gevallen zoals live spraak assistenten en on-device generatie.

Pocket TTS is in de standaard prijslijst, kost 10 credits per 1.000 karakters. Dat maakt het een van de meest economische voice-kloning opties beschikbaar op TextToSpeechAI.

Beide zijn lichtgewicht, CPU-vriendelijke, standaard-tier motoren. Kies Pocket TTS wanneer u spraakklonen nodig hebt, aangezien Kokoro niet ondersteunt. Kies Kokoro wanneer u een bredere taaldekking nodig hebt en hoeft niet te klonen een specifieke stem.

Ja. Nieuwe TextToSpeechAI accounts ontvangen gratis starter credits, en de on-site demo laat je horen Pocket TTS voordat je commit. Meld je gratis aan, upload een korte referentie clip, en het genereren van gekloonde spraak in seconden.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Zak TTS Now

Generate your first audio free. No credit card required.

Start Free