Offene Stimme

Ultra

Instant Voice Cloning mit Granular Tone Control

Moderate Geschwindigkeit
Very Good Qualität
Nein Klonen
10 Sprachen

Über Offene Stimme

OpenVoice ist ein vielseitiges Instant-Stimme-Klonmodell, das eine feinkörnige Kontrolle über den Sprachstil ermöglicht. Im Gegensatz zu anderen Klonmodellen trennt OpenVoice die Sprachidentität vom Sprechstil, sodass Sie eine geklonte Stimme nehmen und verschiedene Töne - fröhlich, traurig, wütend, aufgeregt oder flüstern - ohne neues Referenz-Audio anwenden können.

Hauptmerkmale

Sofortiges Klonen

Klonen Sie jede Stimme aus nur ein paar Sekunden Audio.

Tonsteuerung

Fröhliche, traurige, wütende, aufgeregte oder flüsternde Töne anwenden.

Stilübertragung

Trennen Sie Sprachidentität von Sprachstil für Flexibilität.

Cross-Lingual

Verwenden Sie geklonte Stimmen in verschiedenen Sprachen.

Schnelle Verarbeitung

Effiziente Schlussfolgerung für schnelle Sprachgenerierung.

Quelle öffnen

MIT lizenziert für kommerzielle Anwendungen.

Anwendungsfälle

Emotionaler Inhalt Zeichenanimation Interaktive Spiele Hörbuch-Erzählung Marketing-Videos Virtuelle Assistenten

Verwendung Offene Stimme

  1. 1

    Registrieren Sie sich kostenlos oder versuchen Sie die Demo

    Erstellen Sie ein kostenloses TextToSpeechAI-Konto, um Starter-Credits zu erhalten, oder verwenden Sie die on-page-Demo, um OpenVoice vor dem Commit zu hören. Keine lokale GPU oder Installation wird benötigt - alles läuft auf unseren Servern.

  2. 2

    Wählen Sie OpenVoice und laden Sie einen Referenzclip hoch

    Wählen Sie die OpenVoice-Engine und laden Sie dann ein paar Sekunden sauberes Referenz-Audio hoch, um sofort die Zielstimme zu klonen. OpenVoice erfasst die Lautsprecheridentität, so dass Sie sie über jeden Text und Ton wiederverwenden können.

  3. 3

    Geben Sie Ihren Text ein

    Geben Sie das gewünschte Skript in die geklonte Stimme ein oder fügen Sie es ein. OpenVoice unterstützt rund 10 Sprachen und die linguale Bereitstellung, so dass Sie in einer anderen Sprache als dem Referenzclip schreiben können.

  4. 4

    Wählen Sie einen Ton-Stil und erzeugen

    Wählen Sie eine der neun OpenVoice Tonstile - Standard, freundlich, fröhlich, aufgeregt, traurig, wütend, erschreckt, schreien oder flüstern - dann erzeugen. Die gleiche geklonte Stimme wird mit dieser emotionalen Lieferung sprechen.

  5. 5

    API herunterladen oder verwenden

    Laden Sie Ihr Audio als MP3, WAV oder OGG herunter oder automatisieren Sie die Generation durch die TextToSpeechAI API, indem Sie Ihre geklonte Stimme und Tonart in jeder Anfrage übergeben.

Offene Stimme API

Erzeugen Sie Sprache programmatisch mit der TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice kann in jedem Ton sprechen \u002D fröhlich, traurig oder sogar flüstern.",
    "voice": "en_US-lessac-medium"
  }'

Häufig gestellte Fragen

OpenVoice ist ein fortschrittliches Text-zu-Sprechen- und Stimm-Klonmodell, das die Sprachidentität von der Sprechweise einzigartig trennt. Dadurch können Sie eine Stimme klonen und dann verschiedene emotionale Töne anwenden, ohne für jede Emotion neue Referenz-Audios zu benötigen. Es ist für ausdrucksstarke, kontrollierbare Sprachgenerierung gebaut.

Ja, OpenVoice führt sofortiges Stimmenklonen aus nur wenigen Sekunden Referenz-Audio durch - kein Trainingslauf erforderlich. Sobald eine Stimme erfasst ist, kann OpenVoice diese Identität über jeden beliebigen Text und jeden von Ihnen gewählten Tonstil wiederverwenden.

OpenVoice verwendet eine zweistufige Architektur, die die Basis-Sprachsynthese von der Tonkonvertierung trennt. Nach dem Klonen einer Stimme, können Sie jede von 9 Tonarten - Standard, freundlich, fröhlich, aufgeregt, traurig, wütend, verängstigt, schreiend oder flüsternd - anwenden und die gleiche geklonte Stimme spricht unterschiedlich basierend auf Ihrem gewählten Ton ohne Wiederaufnahme.

OpenVoice unterstützt neun Sprachstile: Standard, freundlich, fröhlich, aufgeregt, traurig, wütend, verängstigt, schreiend und flüsternd. Jeder Stil formt die emotionale Bereitstellung und bewahrt dabei die geklonte Lautsprecheridentität und gibt Ihnen eine feinkörnige Kontrolle darüber, wie eine Zeile gelesen wird.

OpenVoice ist Open-Source unter der permissiven MIT-Lizenz, so ist es kostenlos für den kommerziellen Gebrauch. Wie bei jedem Klonmodell, stellen Sie sicher, dass Sie die richtigen Rechte an jeder Stimme haben, die Sie für kommerzielle Projekte klonen.

OpenVoice unterstützt rund 10 Sprachen, darunter Englisch, Chinesisch, Japanisch, Koreanisch und mehrere europäische Sprachen. Es bietet auch cross-linguales Klonen, so dass Sie eine Stimme in einer Sprache klonen können und sie natürlich in einer anderen sprechen lassen.

OpenVoice hat eine moderate Generationsgeschwindigkeit, die in der Regel einen Satz in 2-4 Sekunden auf einer GPU darstellt. Die Ausgabequalität ist sehr gut, mit klarer Sprachwiedergabe und Tonübertragung, die die Lautsprecheridentität intakt hält und gleichzeitig eine überzeugende Veränderung der emotionalen Leistung bewirkt.

OpenVoice benötigt in der Regel 6-8GB VRAM, abhängig von Batchgröße und Tonkonvertierungslast. Es läuft komfortabel auf mittleren bis oberen mittleren Bereich GPUs, und auf TextToSpeechAI wird all dies auf unseren Servern behandelt, so dass Sie keine lokale Hardware benötigen.

OpenVoice ist eine Ultra-Tier-Engine mit einem Preis von 50 Credits pro 1000 Zeichen. Die Ultra-Tier spiegelt ihre fortschrittliche Tonsteuerung und die zusätzliche Berechnung für die Klonierung plus Stil-Umwandlung Pipeline erforderlich.

OpenVoice ist einzigartig für seine Ton- und Stilsteuerung: Sie können eine geklonte Stimme nehmen und sie wieder als fröhlich, traurig, wütend oder Flüstern. F5-TTS ist schneller und ist unsere Standard-Klon-Engine für natürliche, neutrale Sprache. Wählen Sie OpenVoice, wenn Sie emotionale Stilsteuerung benötigen, und F5-TTS, wenn Sie den schnellsten natürlichen Klon wollen.

Erstellen Sie eine geklonte Stimme, indem Sie Referenz-Audio hochladen, dann geben Sie einen Tonstil in Ihrer API-Anfrage an. Die API wendet Ihren gewählten emotionalen Ton automatisch auf die geklonte Stimme an und gibt das Audio im MP3, WAV oder OGG-Format zurück.

Ja. Melden Sie sich für ein kostenloses TextToSpeechAI-Konto an, um Starter-Gutschriften zu erhalten und versuchen Sie OpenVoice Klonen und Tonsteuerung, oder verwenden Sie die on-page-Demo zuerst. Es gibt kein lokales Setup - Hochladen eines Referenzclips, wählen Sie einen Ton, und erzeugen Sie im Browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try Offene Stimme Now

Generate your first audio free. No credit card required.

Start Free