GPT-SoVITS
PremiumWenig-Schuß-Stimme Klonen mit der höchsten Qualität Ausgabe
Über GPT-SoVITS
GPT-SoVITS kombiniert GPT-ähnliche Sprachmodellierung mit SoVITS-Gesprächekonvertierung, um ein state-of-the-art-Low-Shot-Voice-Klonen zu erreichen. Mit nur 3-10 Sekunden Referenz-Audio plus Transkript erzeugt es bemerkenswert natürliche Sprache, die eng mit der Zielstimme übereinstimmt.
Hauptmerkmale
Wenig-heiße Stimme Klonen
Klonen Sie jede Stimme von 3-10 Sekunden Referenz-Audio mit einem Transkript für beste Qualität.
Cross-Lingual Synthesis
Trainieren Sie in einer Sprache und erzeugen Sie Sprache in Chinesisch, Englisch, Japanisch, Koreanisch oder Kantonesisch.
Höchste Qualität
GPT-SoVITS gehört konsequent zu den qualitativ hochwertigsten Sprach-Klonmodellen, die verfügbar sind.
Quelle öffnen
Vollständig MIT lizenziert mit aktiver Community-Entwicklung und umfangreicher Dokumentation.
Anwendungsfälle
Verwendung GPT-SoVITS
-
1
Erstellen Sie ein kostenloses Konto oder öffnen Sie die Demo
Melde dich für TextToSpeechAI an, um kostenlose Starter-Credits zu erhalten, oder spring direkt in die Demo, um GPT-SoVITS ohne Anmeldung auszuprobieren.
-
2
Wählen Sie GPT-SoVITS und laden Sie einen Referenzclip hoch
Wählen Sie GPT-SoVITS als Ihre Engine, dann laden Sie einen 3-10 Sekunden Referenzclip der Stimme, die Sie klonen möchten. Hinzufügen des Transkripts dieses Clips gibt den saubersten, genauesten Klon.
-
3
Geben Sie Ihren Text ein
Geben Sie den gewünschten Text in die geklonte Stimme ein oder fügen Sie ihn ein. GPT-SoVITS unterstützt Chinesisch, Englisch, Japanisch, Koreanisch und Kantonesisch, einschließlich des cross-lingualen Klonens aus einer Referenz in einer anderen Sprache.
-
4
Erzeugen des Audios
Klicken Sie auf Generierung, um den Auftrag an unsere GPU-Server zu senden. GPT-SoVITS macht ausgezeichnete Qualität geklonte Sprache mit mittlerer Geschwindigkeit, mit 25 Credits pro 1.000 Zeichen in Rechnung gestellt.
-
5
API herunterladen oder verwenden
Laden Sie Ihr fertiges GPT-SoVITS Audio als Datei herunter oder automatisieren Sie die Generierung über die TextToSpeechAI REST API bei api.texttospeechai.com für Produktionsabläufe.
GPT-SoVITS API
Erzeugen Sie Sprache programmatisch mit der TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS produziert hochwertiges Voice\u002DKlonen aus nur wenigen Sekunden Audio.",
"voice": "en_US-lessac-medium"
}'
Häufig gestellte Fragen
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25