Pocket TTS
StandardUltra-let-vægt stemme kloning, der kører i realtid på CPU
Om Pocket TTS
Pocket TTS by Kyutai er en ultra-letvægts 100M parameter tekst-til-tale model, der kører i realtid på CPU. På trods af sin lille størrelse, det understøtter voice kloning fra kun 5 sekunders reference audio. Perfekt til kant implementering, mobile applikationer, og scenarier, hvor GPU ressourcer er begrænsede. I øjeblikket understøtter engelsk og fransk.
Nøglefunktioner
Ultra-Lightweight
100M parametre - kører i realtid på CPU med minimale ressourcer.
Stemmekløvning
Klon enhver stemme fra kun 5 sekunders reference audio, selv på CPU.
Realtid på CPU
Ingen GPU kræves. Genererer tale ved real-time hastighed på standard hardware.
Kant- klar
Lille nok til mobile enheder, Raspberry Pi, og indlejrede systemer.
Brugstilfælde
Hvordan man bruger Pocket TTS
-
1
Tilmeld dig gratis eller prøv demoen
Opret en gratis TextToSpeechAI konto til at modtage startkreditter, eller brug demoen på stedet til at høre Pocket TTS før du tilmelder dig. Ingen GPU eller lokal installation er nødvendig.
-
2
Vælg Pocket TTS og tilføje en stemme til klon
Vælg Pocket TTS som din motor, derefter uploade en kort reference klip på omkring 5 til 10 sekunder til at klone denne stemme. Pocket TTS kører helt på CPU, så kloning er hurtig og let.
-
3
Indtast din tekst
Skriv eller indsæt den engelske eller franske tekst du vil have talt. Hold øje med karaktertallet, da Pocket TTS-regninger med en standardsats på 10 credits pr. 1.000 tegn.
-
4
Generér lyden
Klik på generere og Pocket TTS syntetiserer din tekst i klonet stemme ved real-time hastighed. De fleste klip er klar på få sekunder, fordi modellen er så lille og CPU-effektiv.
-
5
Download eller brug API'en
Download den færdige lyd, eller automatiser generation gennem TextToSpeechAI REST API på api.texttospeechai.com ved hjælp af din konto token. API udsætter den samme Pocket TTS kloning og syntese for dine egne apps.
Pocket TTS API
Generer tale programmatisk ved hjælp af TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS leverer stemmekloning, der kører i realtid, selv på CPU.",
"voice": "en_US-lessac-medium"
}'
Ofte stillede spørgsmål
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10