Fick TTS

Standard

Ultra-lätta röst kloning som körs i realtid på CPU

Very Fast Varvtal
Good Kvalitet
- Ja, det är jag. Kloning
2 Språk

Om jag inte kan Fick TTS

Pocket TTS av Kyutai är en ultra-lättvikt 100M parameter text-till-tal modell som körs i realtid på CPU. Trots sin lilla storlek, stöder det röst kloning från bara 5 sekunder av referensljud. Perfekt för kant distribution, mobila applikationer, och scenarier där GPU resurser är begränsade. För närvarande stöder engelska och franska.

Viktiga egenskaper

Ultralättvikt

100M parametrar - körs i realtid på CPU med minimala resurser.

Röstklappning

Clone någon röst från bara 5 sekunder av referensljud, även på CPU.

Realtid på CPU

Ingen GPU krävs. Genererar tal i realtid hastighet på standard hårdvara.

Kantförtjänt

Tillräckligt liten för mobila enheter, Raspberry Pi, och inbyggda system.

Användningsfall

Kant och mobil distribution Röstassistenter i realtid på CPU IoT och inbyggda enheter Röstkloning med låg resursanvändning

Hur du använder Fick TTS

  1. 1

    Registrera dig gratis eller prova demo

    Skapa ett gratis TextToSpeechAI-konto för att få startpoäng, eller använd demo för att höra Pocket TTS innan du registrerar dig. Ingen GPU eller lokal installation behövs.

  2. 2

    Välj Pocket TTS och lägg till en röst till klon

    Välj Pocket TTS som din motor, ladda sedan upp en kort referens klipp på ca 5 till 10 sekunder för att klona den rösten. Pocket TTS körs helt på CPU, så kloning är snabb och lätt.

  3. 3

    Skriv in din text

    Skriv eller klistra in den engelska eller franska texten du vill tala. Håll ett öga på teckentalet, eftersom Pocket TTS räkningar med standardfrekvensen 10 poäng per 1000 tecken.

  4. 4

    Skapa ljudet

    Klicka på generera och Pocket TTS syntetiserar din text i klonad röst i realtid hastighet. De flesta klipp är redo på några sekunder eftersom modellen är så liten och CPU-effektiv.

  5. 5

    Ladda ner eller använd API:et

    Ladda ner det färdiga ljudet, eller automatisera generationen genom TextToSpeechAI REST API på api.texttospeechai.com med hjälp av ditt konto token. API exponerar samma Pocket TTS kloning och syntes för dina egna appar.

Fick TTS API: er

Skapa talprogrammatiskt med TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS levererar röstkloning som körs i realtid, även på CPU.",
    "voice": "en_US-lessac-medium"
  }'

Vanliga frågor

Pocket TTS är en ultra-lättviktig text-till-tal modell från Kyutai med endast 100 miljoner parametrar. Den körs i realtid på CPU och stöder röst kloning från 5 sekunder av ljud.

Pocket TTS är licensierad under CC-BY-4.0, vilket tillåter kommersiell användning med tillskrivning. Du måste kreditera Kyutai när du använder den i kommersiella applikationer.

För närvarande Pocket TTS stöder engelska och franska. Fler språk kan läggas till i framtida utgåvor.

Ja! Med endast 100M parametrar, Pocket TTS körs i realtid hastighet på standard CPU hårdvara. Ingen GPU behövs, vilket gör den idealisk för kant distribution och mobila applikationer.

Båda är lätta och kör bra på CPU. Pocket TTS stöder unikt röst kloning (Kokoro gör inte). Kokoro stöder fler språk (9 vs 2). Välj Pocket TTS om du behöver lätt röst kloning, Kokoro om du behöver mer språktäckning.

Ge 5 sekunder referensljud. Pocket TTS extraherar högtalaregenskaper och kan generera nytt tal i den rösten. Kvaliteten förbättras med längre referenser (upp till 10 sekunder).

Ja. Till skillnad från de flesta kloning modeller som kräver en GPU, Pocket TTS utför noll-shot röst kloning helt på CPU tack vare sin lilla 100M-parameter fotavtryck. Du kan klona en röst från en kort klipp även på en bärbar dator eller en board dator.

Pocket TTS släpps under CC-BY-4.0, så du måste kreditera Kyutai som den ursprungliga skaparen när du använder eller omfördelar den. En enkel tillskrivning som "Voice genererad med Pocket TTS av Kyutai" uppfyller licensen för kommersiellt och icke-kommersiellt bruk.

Pocket TTS genererar tal i realtid eller snabbare på en standardprocessor, utan GPU krävs. Detta gör det till en av de mest lyhörda motorer för låg latens användning fall som live röst assistenter och on- device generation.

Pocket TTS är i standardprisnivå, kostar 10 krediter per 1000 tecken. Det gör det till en av de mest ekonomiska röst-kloning alternativ som finns på TextToSpeechAI.

Båda är lätta, CPU-vänliga, standard-tier motorer. Välj Pocket TTS när du behöver röst kloning, eftersom Kokoro inte stöder det. Välj Kokoro när du behöver bredare språktäckning och behöver inte klona en specifik röst.

Ja. Nya TextToSpeechAI konton får fri start krediter, och på plats demo låter du höra Pocket TTS innan du begår. Registrera dig gratis, ladda upp en kort referens klipp, och generera klonat tal på några sekunder.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Fick TTS Now

Generate your first audio free. No credit card required.

Start Free