ਟੀ

Standard

ਕੁਦਰਤੀ ਬੋਲੀ ਨਾਲ ਤੇਜ਼ ਅੰਤ- ਤੋਂ- ਅੰਤ TTSName

Very Fast ਗਤੀ
Good ਕੁਆਲਟੀ
ਕੋਈ ਨਹੀਂ ਕਲੋਨਿੰਗ
10 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ ਟੀ

-efficient, and highly-efficient TTS model. It is designed to generate natural-sounding speech from texts, texts from texts, and texts from texts. It is designed to be used in applications that require high-speed, high-quality, and high-efficiency TTS. It is designed to be used in applications that require high-speed, high-efficiency, and high-efficiency TTS. It is designed to be used in applications that require

ਮੁੱਖ ਫੀਚਰ

ਤੇਜ਼ ਸੰਸਲੇਸ਼ਣ

ਤੇਜ਼ ਬੋਲੀ ਪੈਦਾ ਕਰਨ ਲਈ ਅੰਤ-ਤੱਕ-ਅੰਤ ਢਾਂਚਾ

ਬੈਚ ਪਰੋਸੈਸਿੰਗ

ਇੱਕੋ ਸਮੇਂ ਕਈ ਪਾਠਾਂ ਨੂੰ ਪਰੋਸੈਸ ਕਰੋ ।

ਕੁਦਰਤੀ ਬੋਲੀ

VAE+GAN ਟ੍ਰੇਨਿੰਗ ਕੁਦਰਤੀ ਰਸ ਅਤੇ ਰੀਥਮ ਪੈਦਾ ਕਰਦੀ ਹੈ।

ਬਹੁ- ਸਪੀਕਰ

ਇੱਕਲਾ ਮਾਡਲ ਕਈ ਸਪੀਕਰ ਆਵਾਜ਼ਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਕੁਸ਼ਲ

ਚੰਗੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨਾਲ ਘੱਟ ਮੈਮੋਰੀ ਫੁੱਟ- ਪ੍ਰਿੰਟ ਹੈ ।

ਖੋਲ੍ਹੋ ਸਰੋਤ

ਕਿਸੇ ਵੀ ਵਰਤੋਂ ਲਈ MIT ਲਾਈਸੈਂਸ ਹੈ ।

ਵਰਤੋਂ ਕੇਸ

ਆਡੀਓ ਪੈਦਾ ਕਰੋ ਈ- ਸਿੱਖਿਆ ਪਲੇਟਫਾਰਮ ਨਿਊਜ਼ ਰੀਡਰName ਆਟੋਮੈਟਿਕ ਐਲਾਨ IVR ਸਿਸਟਮ ਉੱਚ- ਵੋਲਟੇਜ ਸਮੱਗਰੀ

ਟੀ Voices

View All 109
LJSpeech (English Female)
EN
VCTK Speaker 225 (English Female)
EN
VCTK Speaker 226 (English Male)
EN
VCTK Speaker 227 (English Male)
EN
VCTK Speaker 228 (English Female)
EN
VCTK Speaker 229
EN
VCTK Speaker 230
EN
VCTK Speaker 231
EN
VCTK Speaker 232
EN
VCTK Speaker 233
EN
VCTK Speaker 234
EN
VCTK Speaker 236
EN

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ ਟੀ

  1. 1

    ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਵਰਤੋਂ

    ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਲੈਣ ਲਈ ਮੁਫਤ TextToSpeechAI ਖਾਤਾ ਬਣਾਓ, ਜਾਂ ਸਾਈਨਅੱਪ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ VITS ਸੁਣਨ ਲਈ ਆਨ-ਪੇਜ ਡੈਮੋ ਵਰਤੋਂ।

  2. 2

    VITS ਆਵਾਜ਼ ਜਾਂ ਸਪੀਕਰ ਚੁਣੋ

    ਆਵਾਜ਼ ਲਾਇਬਰੇਰੀ ਝਲਕ ਅਤੇ VITS ਬੈਜ ਨਾਲ ਨਿਸ਼ਾਨਬੱਧ ਆਵਾਜ਼ ਚੁਣੋ । VCTK ਸਪੀਕਰ ਸੈੱਟ ਸਮੇਤ ਬਹੁ- ਸਪੀਕਰ VITS ਲਾਇਬਰੇਰੀ ਤੁਹਾਨੂੰ ਕਈ ਵੱਖ ਵੱਖ ਆਵਾਜ਼ਾਂ ਵਿੱਚੋਂ ਚੁਣਨ ਦਿੰਦੀ ਹੈ ।

  3. 3

    ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

    ਟੈਕਸਟ, ਜੋ ਕਿ ਤੁਸੀਂ ਐਡੀਟਰ ਵਿੱਚ ਬੋਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਲਿਖੋ ਜਾਂ ਚੇਪੋ । VITS ਲੰਬੇ ਪਾਠ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਸੰਭਾਲਦਾ ਹੈ ਅਤੇ ਬੈਚ ਅਤੇ ਵੱਡੇ ਆਕਾਰ ਦੇ ਸਮੱਗਰੀ ਲਈ ਢੁੱਕਵਾਂ ਹੈ ।

  4. 4

    ਆਡੀਓ ਬਣਾਓ

    VITS ਨਾਲ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਕਰਨ ਲਈ ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ । ਕਿਉਂਕਿ VITS ਬਹੁਤ ਤੇਜ਼ ਹੈ ਅਤੇ ਸਟੈਂਡਰਡ- ਟਾਇਰ (10 ਕ੍ਰੈਡਿਟ ਪ੍ਰਤੀ 1000 ਅੱਖਰ) ਹੈ, ਨਤੀਜੇ ਘੱਟ ਕੀਮਤ ਉੱਤੇ ਤੇਜ਼ੀ ਨਾਲ ਮਿਲਦੇ ਹਨ ।

  5. 5

    API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

    MP3, WAV ਜਾਂ OGG ਦੇ ਰੂਪ ਵਿੱਚ ਆਡੀਓ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਆਟੋਮੈਟਿਕ ਬਣਾਉਣ ਲਈ TextToSpeechAI REST API ਰਾਹੀਂ VITS ਆਡੀਓ ਕਾਲ ਕਰੋ ।

ਟੀ API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS ਤੇਜ਼, ਕੁਦਰਤੀ ਬੋਲੀ ਦੇ ਨਾਲ ਵੱਡੇ ਆਕਾਰ ਦੇ ਐਪਲੀਕੇਸ਼ਨ ਦਿੰਦਾ ਹੈ ।",
    "voice": "vits-ljspeech"
  }'

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

VITS (ਵਾਇਰਲੈਸ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਐਂਡ- ਟੂ- ਐਂਡ ਨਯੂਰਲ TTS ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਵਿਰੋਧੀ GAN ਟਰੇਨਿੰਗ ਨਾਲ ਇੱਕ ਵਾਇਰਲੈਸ ਆਟੋ- ਇੰਕੋਡਰ ਨੂੰ ਜੋੜਦਾ ਹੈ । ਇਹ ਇੱਕ ਇੱਕਲੇ ਪਾਸੇ ਵਿੱਚ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਤੇਜ਼ ਅਤੇ ਕੁਸ਼ਲ ਹੈ । ਤੁਸੀਂ TextToSpeechAI ਉੱਤੇ VITS ਮੁਫ਼ਤ ਵਿੱਚ ਵਰਤ ਸਕਦੇ ਹੋ ।

ਹਾਂ, VITS MIT ਲਾਈਸੈਂਸ ਅਧੀਨ ਓਪਨ- ਸੋਰਸ ਹੈ, ਇਸ ਲਈ ਇਹ ਬਿਨਾਂ ਕਿਸੇ ਪਾਬੰਦੀ ਦੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਵਪਾਰਕ ਉਤਪਾਦਾਂ ਅਤੇ ਸੇਵਾਵਾਂ ਵਿੱਚ ਵਿਆਪਕ ਤੌਰ ਤੇ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ । TextToSpeechAI ਉੱਤੇ, VITS ਦੀ ਕੀਮਤ ਸਟੈਂਡਰਡ ਟਾਇਰ ਉੱਤੇ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 10 ਕਰੈਡਿਟ ਹੈ ।

TextToSpeechAI ਇੱਕ ਵੱਡੀ ਬਹੁ- ਸਪੀਕਰ VITS ਲਾਇਬਰੇਰੀ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ VCTK ਆਵਾਜ਼ ਸੈੱਟ ਸ਼ਾਮਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਕਈ ਅੰਗਰੇਜ਼ੀ ਸਪੀਕਰ ਹਨ । ਇੱਕ VITS ਮਾਡਲ ਕਈ ਸਪੀਕਰ ਹੋਸਟ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ ਕਿ ਤੁਸੀਂ ਇੰਜਣਾਂ ਨੂੰ ਬਦਲਣ ਤੋਂ ਬਿਨਾਂ ਕਈ ਵੱਖ ਵੱਖ ਆਵਾਜ਼ਾਂ ਵਿੱਚੋਂ ਚੁਣ ਸਕਦੇ ਹੋ ।

VITS ਸਹਿਯੋਗ ਟਰੇਨਿੰਗ ਮਾਡਲ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ । ਆਮ VITS ਮਾਡਲ ਅੰਗਰੇਜ਼ੀ, ਚੀਨੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ, ਜਰਮਨ, ਫਰੈਂਚ ਅਤੇ ਹੋਰ ਮੁੱਖ ਭਾਸ਼ਾਵਾਂ, VCTK ਡਾਟਾਸੈੱਟ ਤੋਂ ਬਹੁ- ਬੋਲਣ ਵਾਲੇ ਅੰਗਰੇਜ਼ੀ ਨਾਲ ਕਵਰ ਕਰਦੇ ਹਨ ।

VITS ਬਹੁਤ ਤੇਜ਼ ਹੈ, ਰੀਅਲ- ਟਾਈਮ ਜਾਂ GPU ਉੱਤੇ ਤੇਜ਼ੀ ਨਾਲ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਸ ਦਾ ਐਂਡ- ਟੂ- ਐਂਡ ਆਰਕੀਟੈਕਚਰ ਹੋਰ ਮਾਡਲਾਂ ਦੇ ਕਈ ਪਰੋਸੈਸ ਸਟੇਜਾਂ ਤੋਂ ਬਚਦਾ ਹੈ, ਇਸ ਲਈ VITS ਬੈਚ ਅਤੇ ਉੱਚ- ਵੋਲਟੇਜ ਸੰਸਲੇਸ਼ਣ ਲਈ ਵਧੀਆ ਹੈ ।

ਨਹੀਂ, VITS ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਨਹੀਂ ਹੈ । ਇਹ ਇੱਕ ਸੈਪਲ ਤੋਂ ਇੱਕ ਟਾਰਗੇਟ ਬੋਲੀ ਦੀ ਕਾਪੀ ਕਰਨ ਦੀ ਬਜਾਏ ਪਹਿਲਾਂ- ਟਰੇਨਡ ਬਹੁ- ਸਪੀਕਰ ਮਾਡਲ ਵਰਤਦਾ ਹੈ । TextToSpeechAI ਉੱਤੇ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਇਸ ਦੀ ਬਜਾਏ F5- TTS ਜਾਂ GPT- SoVITS ਵਰਤੋਂ ।

VITS ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਅਤੇ ਰਿਦਮ ਨਾਲ ਚੰਗੀ ਕੁਆਲਟੀ ਆਡੀਓ ਬਣਾਉਦਾ ਹੈ । ਜਦੋਂ ਕਿ ਇਹ StyleTTS2ਜਾਂ Tortoise ਦੇ ਪੱਧਰ ਉੱਤੇ ਨਹੀਂ ਹੈ, ਇਹ ਆਪਣੀ ਸਪੀਡ ਲਈ ਵਧੀਆ ਕੁਆਲਟੀ ਦਿੰਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਬੈਚ ਪਰੋਸੈਸਿੰਗ ਲਈ ।

VITS ਮੈਮੋਰੀ- ਕੁਸ਼ਲ ਹੈ, ਆਮ ਤੌਰ ਉੱਤੇ ਸਿਰਫ ਕੁਝ GB VRAM ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ (4GB ਦੇ ਆਸ ਪਾਸ) । ਇਹ ਗਾਹਕ GPUs ਉੱਤੇ ਆਰਾਮ ਨਾਲ ਚੱਲਦਾ ਹੈ, ਅਤੇ TextToSpeechAI ਉੱਤੇ ਸਭ ਰੈਂਡਰਿੰਗ ਸਾਡੇ ਸਰਵਰਾਂ ਉੱਤੇ ਹੁੰਦੀ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ ।

VITS ਅਤੇ Piper ਦੋਵੇਂ ਹੀ TextToSpeechAI ਉੱਤੇ MIT- ਲਾਈਸੈਂਸ ਸਟੈਂਡਰਡ- ਟਾਇਰ ਇੰਜਣ ਹਨ । Piper ਸਭ ਤੋਂ ਹਲਕਾ ਅਤੇ ਤੇਜ਼ ਚੋਣ ਹੈ, ਜਦੋਂ ਕਿ VITS ਇੱਕ ਵੱਡੀ ਬਹੁ- ਸਪੀਕਰ ਲਾਇਬਰੇਰੀ (VCTK ਸਮੇਤ) ਦਿੰਦਾ ਹੈ, ਜੋ ਕਿ ਥੋੜ੍ਹੀ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਹੈ । ਕਦੇ ਵੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਨਹੀਂ ਹੈ ।

VITS ਇੱਕ ਸਟੈਂਡਰਡ- ਟਾਇਰ ਇੰਜਣ ਹੈ, ਜਿਸ ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 10 ਕਰੈਡਿਟ ਹੈ । ਇਹ ਸਾਡੀ ਸਭ ਤੋਂ ਘੱਟ ਕੀਮਤ ਵਾਲੀ ਟਾਈਰ ਹੈ, ਜੋ ਕਿ VITS ਮਾਡਲ ਦੀ ਕੁਸ਼ਲਤਾ ਅਤੇ ਤੇਜ਼ ਕੁਦਰਤੀਤਾ ਦੇ ਕਾਰਨ ਹੈ ।

VITS ਆਡੀਓ ਨੂੰ 22050Hz ਤੇ ਬਣਾਉਂਦਾ ਹੈ । TextToSpeechAI ਰਾਹੀਂ ਤੁਸੀਂ MP3, WAV ਜਾਂ OGG ਫਾਰਮੈਟ ਦੀ ਮੰਗ ਕਰ ਸਕਦੇ ਹੋ, ਆਟੋਮੈਟਿਕ ਰੂਪ ਵਿੱਚ ਤੁਹਾਡੇ ਲਈ ਸੰਚਾਰ ਕੀਤਾ ਜਾਵੇਗਾ ।

ਮੁਫਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ TextToSpeechAI ਉੱਤੇ ਰਜਿਸਟਰ ਕਰੋ, ਫਿਰ VITS ਆਵਾਜ਼ ਚੁਣੋ, ਆਪਣਾ ਪਾਠ ਦਿਓ ਅਤੇ ਆਡੀਓ ਬਣਾਓ। ਤੁਸੀਂ ਇੱਕ ਅਕਾਊਂਟ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ VITS ਸੁਣਨ ਲਈ ਡੀਮੋ ਵੀ ਵਰਤ ਸਕਦੇ ਹੋ, ਅਤੇ ਇੱਕ ਵਾਰ ਰਜਿਸਟਰ ਹੋਣ ਉੱਤੇ VITS ਨੂੰ ਸਾਡੇ REST API ਰਾਹੀਂ ਪਹੁੰਚ ਸਕਦੇ ਹੋ।

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 10
  • GPU VRAM 1-2GB
  • Credits/1000 chars 10

Try ਟੀ Now

Generate your first audio free. No credit card required.

Start Free