ስለ ቪቲኤስ
-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for efficient synthesis. VITS is excellent for batch processing and applications requiring efficient synthesis. It combines variational autoencoders with adversarial learning for
የቁልፍ ባህሪያት
ፈጣን ማቀናጀት
የመጨረሻ-ወደ-መጨረሻ አርክቴክቸር ለፍጥነት ንግግር ማምረት.
ፋይል አጥፉ
በአንድ ጊዜ ብዙ ጽሑፎችን በፍጥነት ይፍጠሩ
የቋንቋ ምርጫዎች
VAE+GAN ስልጠና ተፈጥሯዊ የድምፅ ቅርፅና ሪትምን ያመነጫል።
ብዙ-ተናጋሪ
አንድ ሞዴል ብዙ ተናጋሪ ድምጾችን ይደግፋል
ፋይዳ ያለው
ጥሩ ውጤት ያለው ዝቅተኛ የማስታወሻ ቦታ
የክፍል ፋይል
MIT ለየትኛውም የጠቀሙበት ሁኔታ ፈቃድ
ጥቅም
ቪቲኤስ Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENእንዴት እንደሚጠቀሙ ቪቲኤስ
-
1
ነጻ ምዝገባ ወይም ዲሞን ይሞክሩ
ነጻ TextToSpeechAI ሒሳብ ለመፍጠር መጀመርያ ክሬዲቶች ማግኘት, ወይም VITS ከመመዝገብዎ በፊት ለመስማት በገጽ ላይ ዲሞን ይጠቀሙ.
-
2
VITS ድምፅ ወይም ተናጋሪ ይምረጡ
የድምፅ መዝገብ ቤትን አግኝ እና በቪቲኤስ ባጅ የተቀመጠውን ድምፅ ይምረጡ። የቪቲኤስ መዝገብ ቤት በብዙ-ተናጋሪ፣ በቪሲቲኬ ተናጋሪ ሰሌዳም ውስጥ፣ ከብዙ የተለዩ ድምጾች ውስጥ መምረጥዎን ያስችልዎታል።
-
3
ጽሑፉን አስገባ
ፈልግ
-
4
ድምፅን አስጀምር
VITS ጋር ንግግር ለማቀላቀል ጠቅ ያድርጉ. VITS በጣም ፈጣን እና ስታንዳርድ-ደረጃ (10 ክሬዲቶች ለ 1000 አሃዞች) ነው, ውጤቶች በፍጥነት በጥቂት ወጪ ይመለሳሉ.
-
5
መተግበሪያውን ይጫኑ
የጨረሰውን ድምፅ እንደ MP3, WAV, ወይም OGG ያውርዱ፣ ወይም በራስዎ ፕሮግራም ውስጥ ማመቻቸትን ለማመቻቸት በ TextToSpeechAI REST API ውስጥ ተመሳሳይ የ VITS ድምፅን ጠራሩ።
ቪቲኤስ መተግበሪያዎች
የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "VITS ፈጣን, ለከፍተኛ መጠን ፕሮግራሞች ተፈጥሯዊ ንግግር ይሰጣል.",
"voice": "vits-ljspeech"
}'
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10