TTS de poștă

Standard

Clonarea vocală ultra-ponderală care funcționează în timp real pe CPU

Very Fast Viteza
Good Calitate
Da. Clonarea
2 Limbi

Despre TTS de poștă

Pocket TTS by Kyutai este un model de text-to-speech ultra-lumină 100M care funcționează în timp real pe CPU. În ciuda dimensiunilor sale mici, el suportă clonarea vocală de la doar 5 secunde de audio de referință. Perfect pentru implementarea de borduri, aplicații mobile și scenarii în care resursele GPU sunt limitate. În prezent suportă engleza și franceza.

Caracteristici cheie

Grad ultra ușor

Parametrii 100M - rulează în timp real pe CPU cu resurse minime.

Clonarea vocii

Clonează orice voce de la doar 5 secunde de audio de referință, chiar și pe CPU.

Timpul real pe CPU

Nu este necesar GPU. Generati discursul la viteza in timp real pe hardware-ul standard.

Edge- Ready

Destul de mic pentru dispozitive mobile, Raspberry Pi, și sisteme încorporate.

Cazuri de utilizare

Implementarea bordului și a mobilului Asistenți vocali în timp real pe CPU Dispozitive de iot și de încorporat Clonarea vocală de resurse reduse

Cum să utilizaţi TTS de poștă

  1. 1

    Inregistrează-te gratuit sau încercați demo

    Creați un cont TextToSpeechAI gratuit pentru a primi credite de pornire, sau folosiți demo-ul pe site pentru a auzi Pocket TTS înainte de a se înscrie. Nu este necesară nicio GPU sau instalație locală.

  2. 2

    Selectați Pocket TTS și adaugă o voce la clonă

    Alege Pocket TTS ca motor, apoi încărca un scurt clip de referință de aproximativ 5-10 secunde pentru a clona acea voce. Pocket TTS funcționează complet pe CPU, astfel încât clonarea este rapid și uşoară.

  3. 3

    Introduceți textul

    Tip sau încolți textul englez sau francez pe care doriți să vorbiți. Fii atent la număr de personaje, deoarece facturile Pocket TTS la rata standard de 10 credite la 1000 de caractere.

  4. 4

    Generați audio

    Click genera si Pocket TTS sintetizează textul în voce clonat la viteza reală. Majoritatea clipurilor sunt gata în secunde deoarece modelul este atât de mic și eficient de CPU.

  5. 5

    Descărcați sau folosiți API

    Descarcă audio finit, sau automatizează generația prin TextToSpeechAI REST API la api.texttospeechai.com folosind tokenul contului dvs. API expune același clonare și sinteză Pocket TTS pentru propriile aplicații.

TTS de poștă API

Generați discursul programmatic folosind API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS oferă clonarea vocală care se execută în timp real, chiar și pe CPU.",
    "voice": "en_US-lessac-medium"
  }'

Întrebări frecvente

Pocket TTS este un model de text-to-speech ultra-luz din Kyutai cu doar 100 de milioane de parametri. Se funcționează în timp real pe CPU și suportă clonarea vocală de la 5 secunde de audio.

Pocket TTS este licențiat sub CC-BY-4.0, care permite utilizarea comercială cu atribuție. Trebuie să crediteze Kyutai atunci când îl utilizați în aplicații comerciale.

În prezent Pocket TTS suportă engleza și franceză. Mai multe limbi pot fi adăugate în viitoarele versiuni.

Da! Cu doar parametrii de 100M, Pocket TTS funcționează la viteza în timp real pe hardware-ul de CPU standard. Nu este nevoie de GPU, ceea ce o face ideal pentru implementarea de borduri și aplicații mobile.

Ambele sunt uşoare şi rulează bine pe CPU. Pocket TTS suportă unic clonarea vocală (Kokoro nu). Kokoro suportă mai multe limbi (9 vs 2). Alege Pocket TTS dacă aveţi nevoie de clonarea vocală uşoară, Kokoro dacă aveţi nevoie de mai multe acoperiri limbi.

Asigurați 5 secunde de audio de referință. Extractele de pochetă TTS caracteristici de vorbitor și poate genera un nou discurs în acea voce. Calitatea îmbunătățește cu referințe mai lungi (până la 10 secunde).

Da. Spre deosebire de cele mai multe modele de clonare care necesită o GPU, Pocket TTS efectuează clonarea vocală zero-shot complet pe CPU datorită amprenta ei mici 100M-parametr. Puteți clona o voce dintr-un clip scurt chiar și pe un computer laptop sau un singur tablou.

Pocket TTS este lansat sub CC-BY-4.0, astfel încât trebuie să crediteze Kyutai ca creator original atunci când îl utilizați sau redistribuiți. O atribuție simplă, cum ar fi "Voice generate cu Pocket TTS de Kyutai" satisface licența pentru utilizarea comercială și necomercială.

Pocket TTS generează vorbire în timp real sau mai rapid pe o CPU standard, fără GPU necesar. Acest lucru face unul dintre motoarele cele mai receptive pentru cazurile de utilizare de latență redusă, precum asistenții vocali live și generarea de dispozitive.

Pocket TTS este în nivelul standard de preț, costând 10 credite pe 1000 de caractere. Asta o face una dintre cele mai economice opțiuni de blocare vocală disponibile pe TextToSpeechAI.

Ambele sunt uşoare, uşoare, CPU-friendly, standard-tier motoare. Selecta Pocket TTS atunci când aveți nevoie de clonare vocală, deoarece Kokoro nu îl suportă. Selecta Kokoro atunci când aveți nevoie de acoperire mai largă limba și nu trebuie să cloneze o voce specifică.

Da. Conturile noi TextToSpeechAI primesc credite de pornire gratuite, iar demo-ul pe site vă permite să auziți Pocket TTS înainte de a comite. Înregistrează-te gratuit, încărcă un clip de referință scurt și generați discurs clonat în secunde.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try TTS de poștă Now

Generate your first audio free. No credit card required.

Start Free