GPT- ਸੋਵੀਟ

Premium

ਉੱਚ ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਨਾਲ ਕੁਝ ਸ਼ੌਟ ਵੌਇਸ ਕਲੋਨਿੰਗ

Medium ਗਤੀ
Excellent ਕੁਆਲਟੀ
ਹਾਂ ਕਲੋਨਿੰਗ
5 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ GPT- ਸੋਵੀਟ

-quality speech clones.

ਮੁੱਖ ਫੀਚਰ

ਕੁਝ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ

ਸਭ ਤੋਂ ਵਧੀਆ ਕੁਆਲਟੀ ਲਈ ਇੱਕ ਟਰਾਂਸਕਰੀਪਟ ਨਾਲ 3-10 ਸਕਿੰਟ ਦੇ ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਕੋਈ ਵੀ ਆਵਾਜ਼ ਕਲੋਨ ਕਰੋ ।

ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਸੰਸਲੇਸ਼ਣ

ਇੱਕ ਭਾਸ਼ਾ ਉੱਤੇ ਟਰੇਨਿੰਗ ਅਤੇ ਚੀਨੀ, ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਜਾਂ ਕੈਂਟੋਨੀਜ਼ ਵਿੱਚ ਬੋਲੀ ਬਣਾਓ ।

ਸਭ ਤੋਂ ਉੱਚੀ ਕੁਆਲਟੀ

GPT-SoVITS ਨੂੰ ਲਗਾਤਾਰ ਉਪਲੱਬਧ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲੀਆਂ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਮਾਡਲਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਖੋਲ੍ਹੋ ਸਰੋਤ

ਪੂਰੀ ਤਰ੍ਹਾਂ MIT ਲਾਇਸੈਂਸ, ਸਰਗਰਮ ਭਾਈਚਾਰੇ ਵਿਕਾਸ ਅਤੇ ਵਿਸਤ੍ਰਿਤ ਦਸਤਾਵੇਜ਼ਾਂ ਨਾਲ ।

ਵਰਤੋਂ ਕੇਸ

ਪਰੋਫੈਸ਼ਨਲ ਬੋਲੀ ਕਲੋਨਿੰਗ ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਡਬਿੰਗ ਅਤੇ ਲੋਕਲਾਈਜ਼ੇਸ਼ਨ ਆਡੀਓਬੁੱਕ ਉਤਪਾਦਨ ਅੱਖਰ ਬੋਲੀ ਡਿਜ਼ਾਇਨ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ GPT- ਸੋਵੀਟ

  1. 1

    ਮੁਫਤ ਅਕਾਊਂਟ ਬਣਾਓ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

    ਮੁਫਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ TextToSpeechAI ਲਈ ਸਾਈਨ ਅਪ ਕਰੋ, ਜਾਂ ਸਿੱਧਾ ਡੀਮੋ ਵਿੱਚ ਜਾਓ GPT-SoVITS ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਬਿਨਾਂ ਸਾਈਨ ਅਪ ਦੀ ਲੋੜ।

  2. 2

    GPT-SoVITS ਚੁਣੋ ਅਤੇ ਇੱਕ ਹਵਾਲਾ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ

    ਆਪਣੇ ਇੰਜਣ ਵਜੋਂ GPT-SoVITS ਚੁਣੋ, ਫਿਰ ਤੁਸੀਂ ਕਲੋਨ ਕਰਨ ਲਈ ਵੌਇਸ ਦਾ 3-10 ਸਕਿੰਟ ਦਾ ਰਿਫਰੈਸ਼ਨ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ। ਇਸ ਕਲਿੱਪ ਦਾ ਟਰਾਂਸਕਰੀਪਟ ਸ਼ਾਮਲ ਕਰਨ ਨਾਲ ਸਭ ਤੋਂ ਸਾਫ਼, ਸਭ ਤੋਂ ਸਹੀ ਕਲੋਨ ਮਿਲਦਾ ਹੈ।

  3. 3

    ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

    ਟੈਕਸਟ, ਜੋ ਕਿ ਤੁਸੀਂ ਕਲੋਨ ਵੌਇਸ ਵਿੱਚ ਬੋਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਲਿਖੋ ਜਾਂ ਚੇਪੋ। GPT-SoVITS ਚੀਨੀ, ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਅਤੇ ਕੈਂਟੋਨੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ, ਜਿਸ ਵਿੱਚ ਹੋਰ ਭਾਸ਼ਾ ਵਿੱਚ ਹਵਾਲਾ ਤੋਂ ਕ੍ਰਾਸ-ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਵੀ ਸ਼ਾਮਲ ਹੈ।

  4. 4

    ਆਡੀਓ ਬਣਾਓ

    ਸਾਡੇ GPU ਸਰਵਰਾਂ ਨੂੰ ਜਾਬ ਭੇਜਣ ਲਈ ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ । GPT-SoVITS ਮੱਧਮ ਗਤੀ ਉੱਤੇ ਵਧੀਆ ਕੁਆਲਟੀ ਦੀ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਲਈ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 25 ਕਰੈਡਿਟ ਬਿੱਲ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ।

  5. 5

    API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

    ਆਪਣੀ ਪੂਰੀ GPT-SoVITS ਆਡੀਓ ਨੂੰ ਫਾਇਲ ਵਾਂਗ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ TextToSpeechAI REST API ਨਾਲ api.texttospeechai.com ਉੱਤੇ ਉਤਪਾਦਨ ਵਰਕਫਲੋ ਲਈ ਆਟੋਮੈਟਿਕ ਬਣਾਓ।

GPT- ਸੋਵੀਟ API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "GPT\u002DSoVITS ਆਡੀਓ ਦੇ ਕੁਝ ਸਕਿੰਟਾਂ ਤੋਂ ਹੀ ਉੱਚ ਕੁਆਲਟੀ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਪੈਦਾ ਕਰਦਾ ਹੈ ।",
    "voice": "en_US-lessac-medium"
  }'

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

GPT-SoVITS ਇੱਕ state-of-the-art ਬੋਲੀ ਕਲੋਨਿੰਗ ਸਿਸਟਮ ਹੈ, ਜੋ ਕਿ GPT-style ਭਾਸ਼ਾ ਮਾਡਲਿੰਗ ਅਤੇ SoVITS ਬੋਲੀ ਬਦਲਣ ਨੂੰ ਜੋੜਦਾ ਹੈ । ਇਹ ਕੇਵਲ 3-10 ਸਕਿੰਟ ਦੇ ਰਿਫਰੈਂਡ ਆਡੀਓ ਤੋਂ ਹੀ ਬਹੁਤ ਹੀ ਕੁਦਰਤੀ ਬੋਲੀ ਕਲੋਨ ਬਣਾਉਦਾ ਹੈ ।

ਹਾਂ, GPT-SoVITS ਪੂਰੀ ਤਰ੍ਹਾਂ MIT ਲਾਈਸੈਂਸ ਨਾਲ ਹੈ - ਕੋਡ ਅਤੇ ਮਾਡਲ ਭਾਰ ਦੋਵੇਂ। ਇਹ ਬਿਨਾਂ ਕਿਸੇ ਪਾਬੰਦੀ ਦੇ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਮੁਫ਼ਤ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

GPT-SoVITS ਚੀਨੀ, ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਅਤੇ ਕੈਂਟੋਨੀਜ਼ ਲਈ ਸਹਾਇਕ ਹੈ। ਇਹ ਪਾਰ-ਭਾਸ਼ਾ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਵੀ ਸਹਾਇਕ ਹੈ - ਇੱਕ ਭਾਸ਼ਾ ਵਿੱਚ ਹਵਾਲਾ ਦਿਓ ਅਤੇ ਦੂਜੀ ਭਾਸ਼ਾ ਵਿੱਚ ਬੋਲੀ ਬਣਾਓ।

GPT-SoVITS ਲਗਾਤਾਰ ਉੱਚ ਕੁਆਲਟੀ ਵਾਲੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਮਾਡਲਾਂ ਵਿੱਚ ਰੈਂਕਿੰਗ ਕਰਦਾ ਹੈ । ਇਹ ਬਹੁਤੇ ਬਦਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਰਿਫਰੈਂਡ ਆਡੀਓ ਦੀ ਟਰਾਂਸਕਰੀਪਟ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ।

ਸਭ ਤੋਂ ਵਧੀਆ ਨਤੀਜਿਆਂ ਲਈ, ਇੱਕ ਹਵਾਲਾ ਆਡੀਓ ਕਲਿੱਪ ਅਤੇ ਇਸ ਦੇ ਪਾਠ ਟਰਾਂਸਕਰੀਪਟ ਦੋਵੇਂ ਦਿਓ । ਟਰਾਂਸਕਰੀਪਟ ਮਾਡਲ ਨੂੰ ਹਵਾਲਾ ਬੋਲੀ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ । ਟਰਾਂਸਕਰੀਪਟ ਤੋਂ ਬਿਨਾਂ, ਮਾਡਲ ਕੰਮ ਕਰਦਾ ਹੈ ਪਰ ਕੁਆਲਟੀ ਥੋੜ੍ਹੀ ਘੱਟ ਹੋ ਸਕਦੀ ਹੈ ।

GPT-SoVITS ਲਈ ਇੰਪੁੱਟ ਲੰਬਾਈ ਉੱਤੇ ਨਿਰਭਰ ਕਰਕੇ VRAM ਦੀ 4-8GB ਲੋੜ ਹੈ। ਅਨੁਕੂਲ ਕਾਰਗੁਜ਼ਾਰੀ ਲਈ6GB ਜਾਂ ਵੱਧ GPU ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। TextToSpeechAI ਉੱਤੇ ਮਾਡਲ ਸਾਡੇ GPU ਸਰਵਰਾਂ ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

GPT-SoVITS ਸਭ ਤੋਂ ਵੱਧ ਅਸਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਉਪਲੱਬਧ ਕਰਵਾਉਦਾ ਹੈ, ਇੱਕ ਛੋਟੇ ਹਵਾਲਾ ਕਲਿੱਪ ਤੋਂ ਟਿਮਬਰ, ਅੱਖਰਾਂ ਅਤੇ ਪਰੋਸੌਡੀ ਨੂੰ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਮੁੜ-ਉਪਜਾਈ ਕਰਦਾ ਹੈ। ਹਵਾਲਾ ਆਡੀਓ ਦੀ ਟਰਾਂਸਕਰੀਪਟ ਮੁਹੱਈਆ ਕਰਵਾਉਣ ਨਾਲ ਕੁਆਲਟੀ ਹੋਰ ਵੀ ਵੱਧ ਜਾਂਦੀ ਹੈ, ਕਲੋਨ ਨੂੰ ਸਰੋਤ ਸਪੀਕਰ ਤੋਂ ਅਣਜਾਣ ਬਣਾ ਦਿੰਦੀ ਹੈ।

GPT-SoVITS ਨੂੰ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ ਸਿਰਫ਼ 3-10 ਸਕਿੰਟ ਦੀ ਸਾਫ਼ ਰਿਫਰੈਂਸ ਆਡੀਓ ਦੀ ਲੋੜ ਹੈ। ਇੱਕ ਛੋਟਾ, ਸਾਫ਼ ਸੈਪਲ ਘੱਟੋ-ਘੱਟ ਬੈਕਗਰਾਊਂਡ ਨੋਜ਼ ਨਾਲ ਵਧੀਆ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ, ਅਤੇ ਮਿਲਦੀ ਟਰਾਂਸਕਰੀਪਟ ਸ਼ਾਮਲ ਕਰਨ ਨਾਲ ਸਹੀਤਾ ਹੋਰ ਵਧਦੀ ਹੈ।

GPT- SoVITS ਮੱਧਮ ਗਤੀ ਨਾਲ ਚੱਲਦਾ ਹੈ ਅਤੇ ਵਧੀਆ, ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਦਿੰਦਾ ਹੈ । ਇਹ ਹਲਕੇ ਮਾਡਲਾਂ ਜਿਵੇਂ ਕਿ Piper ਜਾਂ Kokoro ਨਾਲੋਂ ਥੋੜ੍ਹੀ ਗਤੀ ਬਦਲਦਾ ਹੈ, ਪਰ ਇਸ ਨਾਲ ਵਧੇਰੇ ਕੁਦਰਤੀ, ਸਪੱਸ਼ਟ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਮਿਲਦੀ ਹੈ ।

GPT-SoVITS ਇੱਕ ਪ੍ਰੀਮੀਅਮ-ਟਾਇਰ ਮਾਡਲ ਹੈ, ਜਿਸ ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 25 ਕਰੈਡਿਟ ਹੈ। ਇਹ ਸਟੈਂਡਰਡ ਟਾਇਰ (10 ਕਰੈਡਿਟ) ਤੋਂ ਉੱਪਰ ਹੈ ਪਰ Tortoise ਅਤੇ StyleTTS2 (50 ਕਰੈਡਿਟ) ਵਰਗੇ ਅਲਟਰਾ-ਟਾਇਰ ਮਾਡਲਾਂ ਤੋਂ ਹੇਠਾਂ ਹੈ।

ਦੋਵੇਂ ਪ੍ਰੀਮੀਅਮ- ਟਾਇਰ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਇੰਜਣ ਹਨ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਲਾਇਸੈਂਸ ਪ੍ਰਾਪਤ ਹਨ । GPT- SoVITS ਨੂੰ ਕੱਚੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਅਤੇ ਪਾਰ- ਭਾਸ਼ਾ ਪਰੋਸੈਡੀ ਉੱਤੇ ਜਿੱਤ ਮਿਲਦੀ ਹੈ, ਜਦ ਕਿ CosyVoice2 (Apache 2.0) ਬਹੁ- ਭਾਸ਼ਾ ਕਵਰੇਜ ਦਿੰਦਾ ਹੈ । ਦੋਵੇਂ ਮੁਫਤ TextToSpeechAI ਉੱਤੇ ਵਰਤੋਂ ਅਤੇ ਆਪਣੀ ਟਿਕਾਣਾ ਆਵਾਜ਼ ਨਾਲ ਸਭ ਤੋਂ ਵਧੀਆ ਮਿਲਦੀ ਇੱਕ ਚੁਣੋ ।

ਹਾਂ, ਮੁਫਤ TextToSpeechAI ਅਕਾਊਂਟ ਲਈ ਰਜਿਸਟਰਡ ਹੋਵੋ ਤਾਂ ਇੱਕ ਵਾਰੀ ਸਟਾਰਟ ਕਰੈਡਿਟ ਮਿਲੇਗਾ, ਜਾਂ ਡੀਮੋ ਨੂੰ ਅਕਾਊਂਟ ਦੇ ਬਗੈਰ GPT-SoVITS ਸੁਣਨ ਲਈ ਵਰਤੋਂ । ਇਹ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਅਤੇ ਕਰੈਡਿਟ ਪੈਕ ਖਰੀਦਣ ਤੋਂ ਪਹਿਲਾਂ ਕੁਆਲਟੀ ਟੈਸਟ ਕਰਨ ਲਈ ਕਾਫੀ ਹੈ ।

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try GPT- ਸੋਵੀਟ Now

Generate your first audio free. No credit card required.

Start Free