ስለ GPT-ሶቪትስ
GPT-SoVITS combines GPT-style language modeling with SoVITS voice conversion to achieve state-of-the-art few-shot voice cloning. With just 3-10 seconds of reference audio plus a transcript, it produces remarkably natural speech that closely matches the target voice. It excels at cross-lingual synthesis - train on one language and generate in another.
የቁልፍ ባህሪያት
የድምፅ መተካት
ከ3-10 ሰከንዶች የድምፅ መዝገብ ቤት ለጥሩ ጥራት መዝገብ ቤት ጋር ማንኛውንም ድምፅ ክሎን
የቋንቋ ቅንጅት
በአንድ ቋንቋ ላይ ትምህርቶችን በመስጠት በቻይንኛ፣ አማርኛ፣ ጃፓንኛ፣ ኮሪያኛ ወይም ካቶንጎኛ ንግግርን ያመነጫሉ
ከፍተኛ ጥራት
GPT-Sovits በየጊዜው ከሚገኙት ከፍተኛ ጥራት ያላቸው የድምፅ ክሎኒንግ ሞዴሎች መካከል ይቀመጣል.
የክፍል ፋይል
በሙሉ MIT ፈቃድ ጋር ተንቀሳቃሽ ማህበረሰብ ልማት እና ሰፊ ማስረጃዎች.
ጥቅም
እንዴት እንደሚጠቀሙ GPT-ሶቪትስ
-
1
ነጻ የሂሳብ አያያዝን ይፈጥሩ ወይም ዲሞን ይክፈቱ
ነፃ የጀማሪ ክሬዲቶችን ለመቀበል ለ TextToSpeechAI ይመዝገቡ፣ ወይም ቀጥታ ወደ ዲሞው ይወጡ GPT-SoVITS ን ያለ ማስመዝገብ ያስፈልጋል.
-
2
GPT-SoVITSን ይምረጡ እና የመዝገብ ቤትን ቪዲዮ ይጫኑ
GPT-Sovits እንደ መሳሪያዎ ይመርጡ፣ ከዚያም 3-10 ሰከንዶች የሚወስድ የድምፅ መዝገብ ቤትን ከፍ ያድርጉ። የዚህ መዝገብ ቤትን መዝገብ ቤት ማከል በጣም ንጹህ እና ትክክለኛ መዝገብ ቤትን ይሰጣል
-
3
ጽሑፉን አስገባ
የእርስዎን የድምፅ ፋይል ይምረጡ ወይም ይስቀሉ. GPT-Sovits ቻይንኛ, አማርኛ, ጃፓንኛ, ኮሪያኛ, እና ካቶንጎን ይደግፋል, ከሌላ ቋንቋ ጋር ከሚዛመድ ቋንቋ ጋር መቀላቀል ጨምሮ.
-
4
ድምፅን አስጀምር
ስራውን ወደ GPU ሰርቨሮቻችን ለመላክ ሰርዝ. GPT-SoVITS በሁለተኛው ፍጥነት ጥሩ ጥራት ያለው የክሎኒንግ ንግግርን ያቀርባል፣ በ 1,000 አርእስቶች 25 ክሬዲቶች ይከፍላል
-
5
መተግበሪያውን ይጫኑ
የጨረሰውን የጂፒቲ-ሶቪትስ ድምፅ እንደ ፋይል ያውርዱ፣ ወይም በ TextToSpeechAI REST API በ api.texttospeechai.com ለምርት ሥራ ፍሰቶች አውቶማቲክ ማምረት
GPT-ሶቪትስ መተግበሪያዎች
የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSovits ከድምፅ ጥቂት ሰከንዶች ብቻ ከፍተኛ ጥራት ያለው የድምፅ ክሎኒንግ ያወጣል.",
"voice": "en_US-lessac-medium"
}'
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25