Pocket TTS

Standard

Ultra-let-vægt stemme kloning, der kører i realtid på CPU

Very Fast Hastighed
Good Kvalitet
Ja Kloning
2 Sprog

Om Pocket TTS

Pocket TTS by Kyutai er en ultra-letvægts 100M parameter tekst-til-tale model, der kører i realtid på CPU. På trods af sin lille størrelse, det understøtter voice kloning fra kun 5 sekunders reference audio. Perfekt til kant implementering, mobile applikationer, og scenarier, hvor GPU ressourcer er begrænsede. I øjeblikket understøtter engelsk og fransk.

Nøglefunktioner

Ultra-Lightweight

100M parametre - kører i realtid på CPU med minimale ressourcer.

Stemmekløvning

Klon enhver stemme fra kun 5 sekunders reference audio, selv på CPU.

Realtid på CPU

Ingen GPU kræves. Genererer tale ved real-time hastighed på standard hardware.

Kant- klar

Lille nok til mobile enheder, Raspberry Pi, og indlejrede systemer.

Brugstilfælde

Kant og mobil implementering Real-time stemmeassistenter på CPU IoT og indlejrede enheder Low-resource stemme kloning

Hvordan man bruger Pocket TTS

  1. 1

    Tilmeld dig gratis eller prøv demoen

    Opret en gratis TextToSpeechAI konto til at modtage startkreditter, eller brug demoen på stedet til at høre Pocket TTS før du tilmelder dig. Ingen GPU eller lokal installation er nødvendig.

  2. 2

    Vælg Pocket TTS og tilføje en stemme til klon

    Vælg Pocket TTS som din motor, derefter uploade en kort reference klip på omkring 5 til 10 sekunder til at klone denne stemme. Pocket TTS kører helt på CPU, så kloning er hurtig og let.

  3. 3

    Indtast din tekst

    Skriv eller indsæt den engelske eller franske tekst du vil have talt. Hold øje med karaktertallet, da Pocket TTS-regninger med en standardsats på 10 credits pr. 1.000 tegn.

  4. 4

    Generér lyden

    Klik på generere og Pocket TTS syntetiserer din tekst i klonet stemme ved real-time hastighed. De fleste klip er klar på få sekunder, fordi modellen er så lille og CPU-effektiv.

  5. 5

    Download eller brug API'en

    Download den færdige lyd, eller automatiser generation gennem TextToSpeechAI REST API på api.texttospeechai.com ved hjælp af din konto token. API udsætter den samme Pocket TTS kloning og syntese for dine egne apps.

Pocket TTS API

Generer tale programmatisk ved hjælp af TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS leverer stemmekloning, der kører i realtid, selv på CPU.",
    "voice": "en_US-lessac-medium"
  }'

Ofte stillede spørgsmål

Pocket TTS er en ultra-let tekst-til-tale model fra Kyutai med kun 100 millioner parametre. Det kører i realtid på CPU og understøtter stemme kloning fra 5 sekunder af lyd.

Pocket TTS er licenseret under CC- BY-4.0, som tillader kommerciel brug med tildeling. Du skal kreditere Kyutai, når du bruger det i kommercielle applikationer.

I øjeblikket Pocket TTS understøtter engelsk og fransk. Flere sprog kan tilføjes i fremtidige udgivelser.

Ja! Med kun 100M parametre, Pocket TTS kører med real-time hastighed på standard CPU hardware. Ingen GPU er nødvendig, hvilket gør den ideel til kant implementering og mobile applikationer.

Begge er lette og køre godt på CPU. Pocket TTS understøtter unikt stemmekloning (Kokoro gør ikke). Kokoro understøtter flere sprog (9 vs 2). Vælg Pocket TTS, hvis du har brug for letvægts stemme kloning, Kokoro, hvis du har brug for mere sprogdækning.

Giv 5 sekunders reference audio. Pocket TTS udtrækker højttaler egenskaber og kan generere ny tale i denne stemme. Kvalitet forbedrer med længere referencer (op til 10 sekunder).

Ja. I modsætning til de fleste kloning modeller, der kræver en GPU, Pocket TTS udfører nul-shot stemme kloning helt på CPU takket være sin lille 100M-parameter fodaftryk. Du kan klone en stemme fra et kort klip selv på en bærbar computer eller single-board computer.

Pocket TTS er udgivet under CC-BY-4.0, så du skal kreditere Kyutai som den oprindelige skaber, når du bruger eller omfordele det. En simpel tildeling såsom "Voice genereret med Pocket TTS af Kyutai" opfylder licensen til kommerciel og ikke-kommerciel brug ens.

Pocket TTS genererer tale i realtid eller hurtigere på en standard CPU, uden GPU kræves. Dette gør det til en af de mest lydhøre motorer til lav latenstid bruge kasser som live stemme assistenter og on-enhed generation.

Pocket TTS er i standard prissætning niveau, koster 10 kreditter per 1.000 tegn. Det gør det en af de mest økonomiske stemme-cloning muligheder tilgængelige på TextToSpeechAI.

Begge er lette, CPU-venlige, standard-tier motorer. Pick Pocket TTS når du har brug for stemme kloning, da Kokoro ikke understøtter det. Pick Kokoro når du har brug for bredere sprogdækning og ikke behøver at klone en bestemt stemme.

Ja. Nye TextToSpeechAI konti modtager gratis startkreditter, og demoen på stedet lader dig høre Pocket TTS før du begår. Tilmeld dig gratis, uploade et kort referenceklip og generere klonet tale på få sekunder.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Pocket TTS Now

Generate your first audio free. No credit card required.

Start Free