ගැන ටී.
-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for
ප්රධාන විශේෂාංග
වේගවත් සංස්ලේෂණය
ඵලදායිතාවය ඉහළ නැංවීම සඳහා ඵලදායිතාවය ඉහළ නැංවීමේ ක්රියාවලිය ඵලදායිතාවය ඉහළ නැංවීමේ ක්රියාවලිය ලෙස හැඳින්වේ.
කණ්ඩායම් සැකසීම
කාර්යක්ෂමව එකවර බහු පෙළ සැකසීම.
ස්වභාවික කථාව
ඩී.එන්.ඒ. මඟින් රසායනික හා භෞතික ක්රියාකාරකම් සිදු කරයි.
බහු- කථාකරන්නා
යම් යම් කාරණා සම්බන්ධයෙන් යම් යම් ස්ථාවරයන් දරයි.
කාර්යක්ෂම
හොඳ ක්රියාකාරිත්වයක් සහිත අඩු මතක අඩිසැකසුම.
විවෘත මූලාශ්ර
ඕනෑම අවස්ථාවකදී භාවිතා කළ හැකි ක්රමවේදයක් ලෙස ටෙලිග්රාෆ් භාවිතා වේ.
භාවිතය
ටී. Voices
View All 109LJSpeech (English Female)
ENVCTK Speaker 225 (English Female)
ENVCTK Speaker 226 (English Male)
ENVCTK Speaker 227 (English Male)
ENVCTK Speaker 228 (English Female)
ENVCTK Speaker 229
ENVCTK Speaker 230
ENVCTK Speaker 231
ENVCTK Speaker 232
ENVCTK Speaker 233
ENVCTK Speaker 234
ENVCTK Speaker 236
ENභාවිතා කරන ආකාරය ටී.
-
1
නොමිලේ ලියාපදිංචි වන්න හෝ දර්ශනය උත්සාහ කරන්න
ආරම්භක ණය ලබා ගැනීමට නොමිලේ TextToSpeechAI ගිණුමක් නිර්මාණය කරන්න, හෝ ලියාපදිංචි වීමට පෙර VITS අසන්නට පිටුව මත ඩෙමෝ භාවිතා කරන්න.
-
2
VITS හඬ හෝ කථිකයෙකු තෝරන්න
හඬ පුස්තකාලය ගවේෂණය කර VITS බැජ් සමඟ සලකුණු කරන ලද හඬක් තෝරන්න. VCTK කථික කට්ටලය ඇතුළු බහු-කථික VITS පුස්තකාලය, ඔබට විවිධ හඬවල් කිහිපයක් තෝරා ගැනීමට ඉඩ දෙයි.
-
3
ඔබේ පෙළ ඇතුළත් කරන්න
ඔබ සංස්කාරකවරයාට කතා කිරීමට අවශ්ය පෙළ ටයිප් හෝ ඇලවීම. VITS හොඳින් දිගු වාක්ය හැසිරවීම සහ කණ්ඩායම් හා අධික පරිමාව අන්තර්ගතය සඳහා කදිම වේ.
-
4
ශ්රව්යය ජනනය කරන්න
VITS සමග කථාව සංස්ලේෂණය කිරීමට ජනනය ක්ලික් කරන්න. VITS ඉතා වේගවත් හා සම්මත-තලය නිසා (10 1000 අක්ෂර සඳහා ණය), අඩු වියදමකින් ප්රතිඵල ඉක්මනින් ආපසු.
-
5
API බාගත හෝ භාවිතා කරන්න
MP3, WAV, හෝ OGG ලෙස අවසන් ශබ්ද බාගත, හෝ ඔබේම අයදුම්පත තුළ ජනනය ස්වයංක්රීය කිරීමට TextToSpeechAI REST API හරහා එම VITS හඬ ඇමතුම්.
ටී. API
TextToSpeechAI REST API භාවිතා කරමින් වැඩසටහන්ගතව කථාව ජනනය කරන්න.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "ටෙලිවිෂන් යනු ඉතා ඉක්මනින් හා පහසුවෙන් සන්නිවේදනය කළ හැකි සන්නිවේදන මාධ්යයකි.",
"voice": "vits-ljspeech"
}'
නිතර අසන ප්රශ්න
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 10
- GPU VRAM 1-2GB
- Credits/1000 chars 10