Parler-TTS

Premium

Generazione vocale con descrizione di testo

Moderate Velocità
Very Good Qualità
No. Clonazione
1 Lingue

Informazioni Parler-TTS

Parler-TTS è un modello unico che genera voci basate su descrizioni testuali. Invece di scegliere tra voci predefinite, si descrive la voce che si desidera: "Una giovane donna parla chiaramente con un accento americano" o "Un anziano inglese parla lentamente in una voce profonda." Parler-TTS genera poi un discorso corrispondente alla tua descrizione.

Caratteristiche chiave

Descrizioni del testo

Generare voci descrivendo le caratteristiche desiderate.

Controllo creativo

Specificare l'età, il sesso, l'accento, la velocità e lo stile di parlare.

Voci uniche

Crea voci che non esistono nelle librerie pre-made.

Output naturale

Genera un discorso di alta qualità, naturale.

Efficiente

Inferenza veloce per la generazione di voce descritta.

Open Source

Apache 2.0 ha concesso la licenza per uso commerciale.

Casi di utilizzo

Carattere Voce Design Progetti creativi Prototipo Voiceovers Sviluppo del gioco Caratteri audiolibri Creazione di voce personalizzata

Parler-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Come usare Parler-TTS

  1. 1

    Iscriviti gratis o prova la demo

    Crea un account gratuito di TextToSpeechAI per 200 crediti di avviamento, o apri la demo per provare Parler-TTS immediatamente senza registrarti.

  2. 2

    Selezionare Parler-TTS e scrivere una descrizione vocale

    Scegli Parler-TTS come motore, poi scrivi una descrizione vocale in chiaro come "Una giovane donna parla chiaramente con un accento americano." Include età, sesso, accento, ritmo, e l'umore per modellare la voce.

  3. 3

    Inserisci il testo per parlare

    Digitare o incollare lo script che si desidera parlare. Parler-TTS rende questo testo nella voce definita dalla descrizione, quindi mantenere la descrizione e lo script nella stessa lingua (l'inglese funziona meglio).

  4. 4

    Genera il discorso

    Cliccare su genera per inviare il lavoro al nostro backend GPU. Parler-TTS sintetizza audio naturale che corrisponde alla voce descritta, caricato al livello Premium di 25 crediti per 1000 caratteri.

  5. 5

    Scarica o chiama l'API

    Scarica l'audio finito come MP3, WAV, o OGG, o automatizzare la generazione attraverso TextToSpeechAI API passando il testo e la descrizione della voce salvata in ogni richiesta.

Parler-TTS API

Generare la parola programmaticamente usando l'API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Una giovane donna allegra parla con un accento americano.",
    "voice": "parler-female_american"
  }'

Domande frequenti

Parler-TTS è un modello testuale che genera voci da descrizioni testuali. Invece di scegliere voci pre-made, si descrive quello che si vuole: "Una donna calma, matura con un accento australiano che parla a un ritmo moderato."

Parler-TTS è open-source con licenza Apache 2.0. Su TextToSpeechAI, viene addebitato 25 crediti per 1000 caratteri (livello Premium) per le sue capacità uniche di generazione vocale.

Parler-TTS supporta principalmente l'inglese. Le descrizioni vocali funzionano meglio in inglese, anche se il modello può gestire vari accenti inglesi (americano, britannico, australiano, ecc.).

Descrivi le caratteristiche della voce naturalmente: "Una giovane donna parla chiaramente con un accento britannico" o "Un uomo anziano con una voce profonda parla lentamente e con attenzione." Include età, sesso, accento, velocità e umore.

Parler-TTS ha una velocità di generazione moderata, tipicamente 2-5 secondi per frase sulla GPU. L'elaborazione della descrizione vocale aggiunge un minimo di overhead rispetto alla generazione vocale effettiva.

No, Parler-TTS genera voci da descrizioni piuttosto che clonare voci esistenti. Per la clonazione vocale, utilizzare StyleTTS2, F5-TTS, OpenVoice o Tortoise.

Parler-TTS richiede 4-8GB di VRAM a seconda della dimensione del modello. La versione mini funziona con 4GB, mentre il modello completo beneficia di 8GB per prestazioni ottimali.

Sì, Parler-TTS è Apache 2.0 con licenza e supporta l'uso commerciale. Poiché le voci sono generate dalle descrizioni, non ci sono problemi di proprietà della voce.

Includi la descrizione vocale nella richiesta API insieme al testo. La nostra API elabora la descrizione e genera la corrispondenza vocale. Puoi salvare le descrizioni preferite per il riutilizzo.

Parler-TTS produce audio molto buono e naturale con prosodia che corrisponde alla voce descritta. Usisce WAV nativamente, e su TextToSpeechAI è possibile scaricarlo come MP3, WAV, o OGG con conversione automatica.

Entrambi sono motori espressivi open-source, ma differiscono nel controllo. Parler-TTS consente di guidare la voce con una descrizione in chiaro (età, accento, ritmo, umore), mentre Bark aggiunge spunti non verbali come [risate] e musica. Scegli Parler-TTS quando si desidera una voce specifica descritta e Bark quando si desidera la consegna spontanea emozionale.

Sì. Iscriviti gratuitamente a TextToSpeechAI per ricevere 200 crediti di avviamento, o usa la demo per ascoltare Parler-TTS senza un account. Questo è sufficiente per testare diverse descrizioni vocali prima di scegliere un pacchetto di credito.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Parler-TTS Now

Generate your first audio free. No credit card required.

Start Free