TTS tascabile
StandardClonazione vocale ultraleggera che gira in tempo reale sulla CPU
Informazioni TTS tascabile
Pocket TTS di Kyutai è un modello ultraleggero da 100M con parametro testo a bocca che gira in tempo reale sulla CPU. Nonostante le sue dimensioni ridotte, supporta la clonazione vocale da soli 5 secondi di audio di riferimento. Perfetto per la distribuzione di bordo, applicazioni mobili e scenari in cui le risorse della GPU sono limitate. Attualmente supporta l'inglese e il francese.
Caratteristiche chiave
Ultra-Lightweight
100M parametri - esegue in tempo reale sulla CPU con risorse minime.
Clonazione vocale
Clona qualsiasi voce da soli 5 secondi di audio di riferimento, anche sulla CPU.
Tempo reale sulla CPU
Non è richiesta alcuna GPU. Genera la parola alla velocità in tempo reale sull'hardware standard.
Pronti per il bordo
Abbastanza piccolo per i dispositivi mobili, Raspberry Pi, e sistemi incorporati.
Casi di utilizzo
Come usare TTS tascabile
-
1
Iscriviti gratis o prova la demo
Crea un account gratuito TextToSpeechAI per ricevere crediti di avviamento, o utilizzare la demo in loco per ascoltare Pocket TTS prima di iscriversi. Non è necessaria alcuna GPU o installazione locale.
-
2
Selezionare Pocket TTS e aggiungere una voce al clone
Scegliere Pocket TTS come motore, quindi caricare un breve clip di riferimento di circa 5-10 secondi per clonare quella voce. Pocket TTS funziona interamente su CPU, quindi la clonazione è veloce e leggera.
-
3
Inserisci il tuo testo
Digitare o incollare il testo inglese o francese che si desidera parlare. Tenere d'occhio il conteggio dei caratteri, dal Pocket TTS bollette al tasso standard di 10 crediti per 1.000 caratteri.
-
4
Genera l'audio
Cliccare su genera e Pocket TTS sintetizza il testo nella voce clonata a velocità in tempo reale. La maggior parte dei clip sono pronti in pochi secondi perché il modello è così piccolo ed efficiente.
-
5
Scarica o utilizza l'API
Scarica l'audio finito o automatizza la generazione tramite le TextToSpeechAI API REST su api.textospeechai.com utilizzando il token del tuo account. L'API espone la stessa clonazione e sintesi Pocket TTS per le tue applicazioni.
TTS tascabile API
Generare la parola programmaticamente usando l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS offre la clonazione vocale che funziona in tempo reale, anche sulla CPU.",
"voice": "en_US-lessac-medium"
}'
Domande frequenti
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10