விட்ஸ்

Standard

இயற்கையான பேச்சுடன் வேகமான முடிவு- முதல்- முடிவு TTS

Very Fast வேகம்
Good தரம்
இல்லை மாதிரியாக்கம்
10 மொழிகள்

& பற்றி விட்ஸ்

-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for

முக்கியமான அம்சங்கள்

வேகமான சேர்த்தல்

விரைவான உரையாடல் உருவாக்கத்திற்கான முடிவிலிருந்து முடிவிற்கு கட்டமைப்பு.

தொகுப்பு செயல்படுத்தல்

பல உரைகளை ஒரே நேரத்தில் செயல்படுத்து

இயற்கை உரையாடல்

VAE + GAN பயிற்சி இயற்கையான prosody மற்றும் ரிதம் உற்பத்தி.

பல- ஒலியெழுப்பி

ஒரே மாதிரி பல பேச்சாளர் குரல்களை ஆதரிக்கிறது.

திறன்

சிறந்த செயல்திறனுடன் குறைந்த நினைவக இடம்.

திறந்த மூலங்கள்

MIT லைசென்ஸ் எந்த பயன்பாடு வழக்கு.

பயன்பாட்டு வழக்கங்கள்

ஒலி உருவாக்கம் மின்-பயிற்சி தளங்கள் செய்தி வாசிப்பாளர்கள்Name தானாக அறிவிப்புகள் IVR அமைப்புகள் அதிக ஒலியளவு உள்ளடக்கம்

விட்ஸ் Voices

View All 109
LJSpeech (English Female)
EN
VCTK Speaker 225 (English Female)
EN
VCTK Speaker 226 (English Male)
EN
VCTK Speaker 227 (English Male)
EN
VCTK Speaker 228 (English Female)
EN
VCTK Speaker 229
EN
VCTK Speaker 230
EN
VCTK Speaker 231
EN
VCTK Speaker 232
EN
VCTK Speaker 233
EN
VCTK Speaker 234
EN
VCTK Speaker 236
EN

பயன்படுத்துவது எப்படி விட்ஸ்

  1. 1

    இலவசமாக பதிவு செய்து கொள்ளவும் அல்லது முன்மாதிரியை முயற்சிக்கவும்

    ஒரு இலவச TextToSpeechAI கணக்கை உருவாக்கி, துவக்கக் கடன்களைப் பெறவும், அல்லது பதிவு செய்யும் முன் VITS ஐக் கேட்க பக்கத்தில் உள்ள டெமோவைப் பயன்படுத்தவும்.

  2. 2

    VITS குரல் அல்லது ஒலிப்பேசி தேர்ந்தெடு

    குரல் நூலகத்தை உலாவி VITS குறியுடன் குறிக்கப்பட்ட குரலை தேர்ந்தெடு. VCTK ஒலியமைப்பு உள்ளிட்ட பல- ஒலியமைப்பு VITS நூலகம், பல வேறுபட்ட குரல்களை தேர்ந்தெடுக்க அனுமதிக்கிறது.

  3. 3

    உரை உள்ளிடவும்

    உரை தொகுப்பான் உரை உரையாடலை உள்ளிடவும் அல்லது ஒட்டு. VITS நீண்ட பகுதிகளை நன்றாக கையாளும் மற்றும் தொகுப்பு மற்றும் அதிக அளவு உள்ளடக்கத்திற்கு சிறந்தது.

  4. 4

    ஒலியை உருவாக்கு

    VITS உடன் பேசியை சேர்க்க உருவாக்கு என்பதை க்ளிக் செய்யவும். VITS மிகவும் வேகமானது மற்றும் தரநிலை- நிலை (10 கிரெடிட்கள் 1000 எழுத்துக்களுக்கு), விளைவுகள் குறைந்த செலவில் விரைவாக திரும்பும்.

  5. 5

    API ஐ பதிவிறக்கவும் அல்லது பயன்படுத்தவும்

    முடிந்த ஒலியை MP3, WAV, அல்லது OGG ஆக பதிவிறக்கவும், அல்லது அதே VITS குரலை TextToSpeechAI REST API மூலம் அழைக்கவும், உங்கள் பயன்பாட்டில் தானாகவே உருவாக்கவும்.

விட்ஸ் API

TextToSpeechAI REST API ஐப் பயன்படுத்தி மென்பொருள் மூலம் பேசி உருவாக்கவும்.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS, அதிக அளவிலான பயன்பாடுகளுக்கு வேகமான, இயற்கையான உரையாடலை வழங்குகிறது.",
    "voice": "vits-ljspeech"
  }'

அடிக்கடி கேட்கப்படும் கேள்விகள்

VITS (முடிவு- முதல்- முடிவு உரை- இருந்து- பேச்சிற்கு மாறுபடும் கற்றல்) ஒரு முடிவு- முதல்- முடிவு நரம்பு TTS மாதிரி, மாறுபடும் தானியங்கி குறியீட்டாளரை எதிர்மறை GAN பயிற்சியுடன் இணைக்கிறது. இது இயற்கை- ஒலிக்கும் பேச்சை ஒரே ஒரு நுழைவில் உருவாக்குகிறது, இது வேகமாகவும் திறமையாகவும் உள்ளது. நீங்கள் TextToSpeechAI இல் VITS இலவசமாக முயற்சி செய்யலாம்.

ஆம், VITS MIT உரிமத்தின் கீழ் திறந்த மூலமாக உள்ளது, எனவே அது முழுமையான வணிக பயன்பாட்டிற்கு கட்டுப்பாடு இல்லாமல் ஆதரவு அளிக்கிறது. இது வணிக பொருட்கள் மற்றும் சேவைகளில் பரவலாக பயன்படுத்தப்படுகிறது. TextToSpeechAI இல், VITS 1000 எழுத்துக்களுக்கு 10 கிரெடிட்கள் செலவாகும்.

TextToSpeechAI ஒரு பெரிய பல- ஒலியெழுப்பி VITS நூலகத்தை வழங்குகிறது, VCTK குரல் அமைப்பு மற்றும் பல ஆங்கில ஒலியெழுப்பிகள் உள்ளன. ஒரே VITS மாதிரி பல ஒலியெழுப்பிகளை கொண்டுள்ளது, எனவே நீங்கள் பல குரல்களை மாற்றி இஞ்சின்களை மாற்றாமல் தேர்ந்தெடுக்கலாம்.

VITS ஆதரவு பயிற்சி செய்யப்பட்ட மாதிரியை பொறுத்து உள்ளது. பொதுவான VITS மாதிரிகள் ஆங்கிலம், சீனம், ஜப்பான், கொரியா, ஜெர்மன், பிரான்சு மற்றும் மற்ற முக்கிய மொழிகளைக் கொண்டுள்ளன, VCTK தரவுத்தளத்தில் இருந்து பல- பேசுபவர் ஆங்கிலத்தைக் கொண்டுள்ளது.

VITS மிகவும் வேகமானது, உண்மையான நேரத்தில் அல்லது GPU யில் வேகமாக பேசுவதை உருவாக்குகிறது. அதன் முடிவிலிருந்து முடிவிற்கு கட்டமைப்பு மற்ற மாதிரிகளின் பல செயல்படுத்தல் நிலைகளை தவிர்க்கிறது, அதனால் VITS பாக்ஸ் மற்றும் அதிக அளவு சிந்தனைக்கு மிகவும் பொருத்தமானது.

இல்லை, VITS குரல் ஒத்ததை ஆதரிக்காது. இது முன்னே பயிற்சி பெற்ற பல- ஒலியமைப்பு மாதிரிகளை பயன்படுத்துகிறது, ஒரு மாதிரியில் இருந்து இலக்கு குரலை நகலெடுக்காமல். TextToSpeechAI குரல் ஒத்ததை பயன்படுத்த, F5- TTS அல்லது GPT- SoVITS ஐ பயன்படுத்தவும்.

VITS இயற்கையான குரல் மற்றும் மெட்டுகளுடன் நல்ல தரமான ஒலியை உருவாக்குகிறது. இது StyleTTS2அல்லது Tortoise- ன் தரத்தில் இல்லை என்றாலும், இது அதன் வேகத்திற்கு சிறந்த தரத்தை வழங்குகிறது, குறிப்பாக கூட்டு செயலாக்கத்திற்கு.

VITS நினைவக திறன் மிக்கது, சில GB VRAM தேவைப்படும் (4GB வரை). இது வாடிக்கையாளர் GPUs களில் எளிதாக இயங்குகிறது, மற்றும் TextToSpeechAI ல் அனைத்து காட்சிப்படுத்தல்களும் எங்கள் சேவையகங்களில் நடக்கிறது, எனவே உங்களுக்கு உங்கள் சொந்த வன்பொருள் தேவையில்லை.

VITS மற்றும் Piper இருவரும் TextToSpeechAI ல் MIT- ல் அனுமதி பெற்ற நிலையான- தள இயந்திரங்கள். Piper மிகவும் இலகுவான மற்றும் வேகமான தேர்வு, VITS ஒரு பெரிய பல- ஒலியெழுப்பி நூலகத்தை வழங்குகிறது (VCTK உள்ளிட்ட) சிறிதளவு இயற்கையான குரல். எந்தவொரு குரல் ஒத்ததையும் ஆதரிக்காது.

VITS என்பது ஒரு தரமான- நிலை இயந்திரம், 1000 எழுத்துக்களுக்கு 10 கடன்கள் செலவாகும். இது எங்கள் குறைந்த விலை நிலையாகும், VITS மாதிரியின் திறன், வேகமான இயல்பு காரணமாக.

VITS 22050Hz இல் ஒலியை உருவாக்குகிறது. TextToSpeechAI மூலம் நீங்கள் MP3, WAV, அல்லது OGG வடிவங்களை கோரலாம், தானாகவே மாற்றம் செய்யப்படும்.

இலவச ஆரம்பக் கடன்களை பெற TextToSpeechAI ல் பதிவு செய்து கொள்ளுங்கள், பின்னர் VITS குரலை தேர்ந்தெடுத்து, உங்கள் உரையை உள்ளிடவும், ஒலியை உருவாக்கவும். நீங்கள் கணக்கை உருவாக்குவதற்கு முன் VITS யை கேட்கவும், பதிவு செய்தவுடன் VITS ஐ எங்கள் REST API மூலம் அணுகவும் நீங்கள் டெமோவை பயன்படுத்தலாம்.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 10
  • GPU VRAM 1-2GB
  • Credits/1000 chars 10

Try விட்ஸ் Now

Generate your first audio free. No credit card required.

Start Free