Parler-TTS

Premium

Textbeschriebene Sprachgenerierung

Moderate Geschwindigkeit
Very Good Qualität
Nein Klonen
1 Sprachen

Über Parler-TTS

Parler-TTS ist ein einzigartiges Text-zu-Speech-Modell, das Stimmen basierend auf Textbeschreibungen erzeugt. Anstatt aus vordefinierten Stimmen auszuwählen, beschreiben Sie die Stimme, die Sie wollen: „Eine junge Frau spricht klar mit amerikanischem Akzent" oder „Ein älterer Brite spricht langsam in einer tiefen Stimme." Parler-TTS erzeugt dann Rede passend zu Ihrer Beschreibung.

Hauptmerkmale

Textbeschreibungen

Generieren Sie Stimmen, indem Sie gewünschte Eigenschaften beschreiben.

Kreative Steuerung

Geben Sie Alter, Geschlecht, Akzent, Geschwindigkeit und sprechenden Stil.

Einzigartige Stimmen

Erstellen Sie Stimmen, die in vorgefertigten Bibliotheken nicht existieren.

Natürliche Erzeugung

Erzeugt hochwertige, natürlich klingende Sprache.

Effizient

Schnelle Schlussfolgerung für die beschriebene Sprachgenerierung.

Quelle öffnen

Apache 2.0 lizenziert für den kommerziellen Gebrauch.

Anwendungsfälle

Zeichen-Stimme-Design Kreative Projekte Prototyp Voiceovers Spielentwicklung Zeichen des Hörbuchs Benutzerdefinierte Spracherstellung

Parler-TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Verwendung Parler-TTS

  1. 1

    Registrieren Sie sich kostenlos oder versuchen Sie die Demo

    Erstellen Sie ein kostenloses TextToSpeechAI-Konto für 200 Starter-Credits oder öffnen Sie die Demo, um Parler-TTS sofort ohne Anmeldung zu versuchen.

  2. 2

    Wählen Sie Parler-TTS und schreiben Sie eine Sprachbeschreibung

    Wählen Sie Parler-TTS als Motor, dann schreiben Sie eine Klartext-Stimme Beschreibung wie "Eine junge Frau spricht deutlich mit einem amerikanischen Akzent." Inklusive Alter, Geschlecht, Akzent, Tempo und Stimmung, um die Stimme zu gestalten.

  3. 3

    Geben Sie den zu sprechenden Text ein

    Geben Sie das gewünschte Skript ein oder fügen Sie es ein. Parler-TTS gibt diesen Text in der durch Ihre Beschreibung definierten Stimme wieder, so halten Sie die Beschreibung und das Skript in der gleichen Sprache (Englisch funktioniert am besten).

  4. 4

    Erzeugen der Rede

    Klicken Sie auf Generieren, um den Job an unser GPU-Backend zu senden. Parler-TTS synthetisiert natürlich klingende Audio passend zu Ihrer beschriebenen Stimme, auf der Premium-Ebene von 25 Credits pro 1000 Zeichen in Rechnung gestellt.

  5. 5

    API herunterladen oder aufrufen

    Laden Sie das fertige Audio als MP3, WAV oder OGG herunter oder automatisieren Sie die Generierung über die TextToSpeechAI API, indem Sie Ihren Text übergeben und die Sprachbeschreibung in jeder Anfrage gespeichert haben.

Parler-TTS API

Erzeugen Sie Sprache programmatisch mit der TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Eine fröhliche junge Frau spricht mit amerikanischem Akzent.",
    "voice": "parler-female_american"
  }'

Häufig gestellte Fragen

Parler-TTS ist ein Text-zu-Speech-Modell, das Stimmen aus Textbeschreibungen erzeugt. Anstatt vorgefertigte Stimmen auszuwählen, beschreiben Sie, was Sie wollen: "Eine ruhige, reife Frau mit einem australischen Akzent, die in einem moderaten Tempo spricht."

Parler-TTS ist Open Source unter Apache 2.0 Lizenz. Auf TextToSpeechAI, berechnen wir 25 Credits pro 1000 Zeichen (Premium-Tier) für seine einzigartigen Sprachgenerierung Fähigkeiten.

Parler-TTS unterstützt in erster Linie Englisch. Die Sprachbeschreibungen funktionieren am besten in Englisch, obwohl das Modell mit verschiedenen englischen Akzenten umgehen kann (Amerikanisch, Britisch, Australisch, etc.).

Beschreiben Sie die Spracheigenschaften natürlich: „Eine junge Frau spricht deutlich mit britischem Akzent" oder „Ein älterer Mann mit tiefer Stimme spricht langsam und sorgfältig." Dazu gehören Alter, Geschlecht, Akzent, Geschwindigkeit und Stimmung.

Parler-TTS hat eine moderate Erzeugungsgeschwindigkeit, typischerweise 2-5 Sekunden pro Satz auf der GPU. Die Sprachbeschreibungsverarbeitung sorgt für einen minimalen Overhead im Vergleich zur eigentlichen Spracherzeugung.

Nein, Parler-TTS erzeugt Stimmen aus Beschreibungen, anstatt vorhandene Stimmen zu klonen. Zum Stimmenklonen verwenden Sie StyleTTS2, F5-TTS, OpenVoice oder Tortoise.

Parler-TTS benötigt je nach Modellgröße 4-8GB VRAM. Die Mini-Version arbeitet mit 4GB, während das volle Modell von 8GB für optimale Leistung profitiert.

Ja, Parler-TTS ist Apache 2.0 lizenziert und unterstützt die kommerzielle Nutzung. Da Stimmen aus Beschreibungen generiert werden, gibt es keine Bedenken bezüglich des Spracheigentums.

Fügen Sie Ihre Sprachbeschreibung zusammen mit Ihrem Text in die API-Anfrage ein. Unsere API verarbeitet die Beschreibung und erzeugt passende Sprache. Sie können Lieblingsbeschreibungen zur Wiederverwendung speichern.

Parler-TTS produziert sehr gutes, natürlich klingendes Audio mit Prosody, das zu Ihrer beschriebenen Stimme passt. Es gibt WAV nativ aus, und auf TextToSpeechAI können Sie es als MP3, WAV oder OGG mit automatischer Konvertierung herunterladen.

Beide sind ausdrucksstarke, Open-Source-Engines, aber sie unterscheiden sich in der Kontrolle. Parler-TTS lässt Sie die Stimme mit einer Klartextbeschreibung steuern (Alter, Akzent, Tempo, Stimmung), während Bark nonverbale Queues wie [Lachen] und Musik hinzufügt.

Ja. Melden Sie sich für ein kostenloses Konto auf TextToSpeechAI, um 200 Starter-Credits zu erhalten, oder nutzen Sie die Demo, um Parler-TTS ohne Konto zu hören.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Parler-TTS Now

Generate your first audio free. No credit card required.

Start Free