Pocket TTS

Standard

Ultra-lahko kloniranje glasu, ki deluje v realnem času na CPU

Very Fast Hitrost
Good Kakovost
-Da. Kloniranje
2 Jeziki

O projektu Pocket TTS

Pocket TTS by Kyutai je ultra-lahek parametr 100M model, ki teče v realnem času na CPU. Kljub majhni velikosti, podpira kloniranje glasu iz samo 5 sekund referenčnega zvoka. Popoln za napotitev roba, mobilne aplikacije in scenarije, kjer so viri GPU omejeni. Trenutno podpira angleško in francosko.

Ključne lastnosti

Ultra- lahka

100M parametrov - teče v realnem času na CPU z minimalnimi viri.

Kloniranje glasu

Kloniraj glas iz samo 5 sekund referenčnega zvoka, tudi pri CPU.

Realno- čas pri CPU

GPU ni potreben.

Pripravljeni na rob

Dovolj majhna za mobilne naprave, Maline Pi, in vgrajeni sistemi.

Uporabne primere

Uporaba roba in mobilnega telefona Realnočasni glasovni pomočniki na CPU IoT in vgrajene naprave Kloniranje glasu z nizkim virom

Kako uporabljati Pocket TTS

  1. 1

    Vpišite se brezplačno ali poskusite demo

    Ustvarite brezplačno TextToSpeechAI račun za prejemanje zagonskih kreditov ali uporabite demo na mestu, da slišite Pocket TTS pred prijavo. Ni potreben GPU ali lokalna namestitev.

  2. 2

    Izberite Pocket TTS in dodajte glas klonu

    Izberite Pocket TTS kot motor, nato pa naložite kratek referenčni posnetek od približno 5 do 10 sekund, da klonira ta glas. Pocket TTS deluje v celoti na CPU, tako da je kloniranje hitro in lahka.

  3. 3

    Vnesite svoje besedilo

    Vpišite ali prilepite angleško ali francosko besedilo, ki ga želite govoriti. Pazite na število znakov, saj Pocket TTS računi po standardni stopnji 10 kreditov na 1.000 znakov.

  4. 4

    Ustvari zvok

    Kliknite generirati in Pocket TTS sintetizirajo vaše besedilo v kloniranem glasu z realno-časovno hitrostjo. Večina klipov je pripravljena v sekundah, ker je model tako majhen in CPU učinkovit.

  5. 5

    Prenesi ali uporabi API

    Prenesi končno zvočno generacijo ali avtomatsko generacijo skozi TextToSpeechAI REST API na api.texttospeechai.com z žetonom vašega računa. API razkriva isto Pocket TTS kloniranje in sintezo za vaše aplikacije.

Pocket TTS API

Ustvarite govor programsko z uporabo TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS zagotavlja kloniranje glasu, ki teče v realnem času, tudi pri CPU.",
    "voice": "en_US-lessac-medium"
  }'

Pogosta vprašanja

Pocket TTS je ultra-lahek model besedila-to-špeih iz Kyutai z le 100 milijoni parametrov. Teče v realnem času na CPU in podpira kloniranje glasu od 5 sekund avdio.

Pocket TTS je licenciran pod CC-BY-4.0, ki omogoča komercialno uporabo z atribucijo. Pri uporabi v komercialnih aplikacijah morate kreditirati Kyutai.

Trenutno Pocket TTS podpira angleško in francosko. V prihodnje lahko dodamo več jezikov.

Da! Z samo 100M parametri, Pocket TTS teče z realno hitrostjo na standardni procesor strojni stroj. GPU ni potreben, da bi bila idealna za uvajanje roba in mobilne aplikacije.

Oba sta lahka in teči dobro na CPU. Pocket TTS edinstveno podpira kloniranje glasu (Kokoro ne). Kokoro podpira več jezikov (9 vs 2). Izberite Pocket TTS, če potrebujete lahko kloniranje glasu, Kokoro, če potrebujete več jezikovnega pokritja.

Ponudite 5 sekund referenčnega zvoka. Pocket TTS izvleče zvočnike in lahko ustvari nov govor v tem glasu. Kakovost se izboljša z daljšimi referencami (do 10 sekund).

Da. Za razliko od večine modelov kloniranja, ki zahtevajo GPU, Pocket TTS izvaja brez ustrelitveno kloniranje glasa v celoti na CPU zahvaljujoč majhnem 100M parameter odtisu. Lahko klonirate glas iz kratkega posnetka tudi na prenosniku ali enopenzijskem računalniku.

Pocket TTS je sproščen pod CC-BY-4.0, zato morate Kyutai priznati kot prvotni ustvarjalec, ko ga uporabljate ali prerazporedite. Preprosta pripis, kot je "Glas, ki ga ustvarite s Pocket TTS s strani Kyutai" izpolnjuje dovoljenje za komercialno in nekomercialno uporabo tako.

Pocket TTS ustvarja govor v realnem času ali hitrejši na standardnem CPU, brez GPU zahteva. To je eden od najbolj odzivnih motorjev za nizko-lateransko uporabo primerov, kot so živi glasovni pomočniki in na-generacija na napravah.

Pocket TTS je v standardni ravni cen, ki stane 10 kreditov na 1.000 znakov, kar ga naredi eno od najbolj ekonomičnih možnosti za kloniranje glasu na TextToSpeechAI.

Oba sta lahka, prijazna za CPU, standardni motorji. Izberite Pocket TTS, ko potrebujete kloniranje glasu, saj Kokoro ne podpira. Izberite Kokoro, ko potrebujete širše pokritost jezika in ne potrebujete kloniranja določenega glasu.

Da. Novi TextToSpeechAI računov prejemajo brezplačne zagonske kredite, in na kraju demo vam omogoča, da slišite Pocket TTS pred zaključkom. Prijava za brezplačno, naložite kratek referenčni klip in generirati kloniran govor v sekundah.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Pocket TTS Now

Generate your first audio free. No credit card required.

Start Free