GPT- ਸੋਵੀਟ

Premium

ਉੱਚ ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਨਾਲ ਕੁਝ ਸ਼ੌਟ ਵੌਇਸ ਕਲੋਨਿੰਗ

ਮੁਫ਼ਤ ਕੋਸ਼ਿਸ਼ GPT- ਸੋਵੀਟ ਧੁਨ ਝਲਕ (0)

Medium ਗਤੀ

Excellent ਕੁਆਲਟੀ

ਹਾਂ ਕਲੋਨਿੰਗ

5 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ GPT- ਸੋਵੀਟ

-quality speech clones.

ਮੁੱਖ ਫੀਚਰ

ਕੁਝ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ

ਸਭ ਤੋਂ ਵਧੀਆ ਕੁਆਲਟੀ ਲਈ ਇੱਕ ਟਰਾਂਸਕਰੀਪਟ ਨਾਲ 3-10 ਸਕਿੰਟ ਦੇ ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਕੋਈ ਵੀ ਆਵਾਜ਼ ਕਲੋਨ ਕਰੋ ।

ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਸੰਸਲੇਸ਼ਣ

ਇੱਕ ਭਾਸ਼ਾ ਉੱਤੇ ਟਰੇਨਿੰਗ ਅਤੇ ਚੀਨੀ, ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਜਾਂ ਕੈਂਟੋਨੀਜ਼ ਵਿੱਚ ਬੋਲੀ ਬਣਾਓ ।

ਸਭ ਤੋਂ ਉੱਚੀ ਕੁਆਲਟੀ

GPT-SoVITS ਨੂੰ ਲਗਾਤਾਰ ਉਪਲੱਬਧ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲੀਆਂ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਮਾਡਲਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਖੋਲ੍ਹੋ ਸਰੋਤ

ਪੂਰੀ ਤਰ੍ਹਾਂ MIT ਲਾਇਸੈਂਸ, ਸਰਗਰਮ ਭਾਈਚਾਰੇ ਵਿਕਾਸ ਅਤੇ ਵਿਸਤ੍ਰਿਤ ਦਸਤਾਵੇਜ਼ਾਂ ਨਾਲ ।

ਵਰਤੋਂ ਕੇਸ

ਪਰੋਫੈਸ਼ਨਲ ਬੋਲੀ ਕਲੋਨਿੰਗ ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਡਬਿੰਗ ਅਤੇ ਲੋਕਲਾਈਜ਼ੇਸ਼ਨ ਆਡੀਓਬੁੱਕ ਉਤਪਾਦਨ ਅੱਖਰ ਬੋਲੀ ਡਿਜ਼ਾਇਨ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ GPT- ਸੋਵੀਟ

1

ਮੁਫਤ ਅਕਾਊਂਟ ਬਣਾਓ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

ਮੁਫਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ TextToSpeechAI ਲਈ ਸਾਈਨ ਅਪ ਕਰੋ, ਜਾਂ ਸਿੱਧਾ ਡੀਮੋ ਵਿੱਚ ਜਾਓ GPT-SoVITS ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਬਿਨਾਂ ਸਾਈਨ ਅਪ ਦੀ ਲੋੜ।
2

GPT-SoVITS ਚੁਣੋ ਅਤੇ ਇੱਕ ਹਵਾਲਾ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ

ਆਪਣੇ ਇੰਜਣ ਵਜੋਂ GPT-SoVITS ਚੁਣੋ, ਫਿਰ ਤੁਸੀਂ ਕਲੋਨ ਕਰਨ ਲਈ ਵੌਇਸ ਦਾ 3-10 ਸਕਿੰਟ ਦਾ ਰਿਫਰੈਸ਼ਨ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ। ਇਸ ਕਲਿੱਪ ਦਾ ਟਰਾਂਸਕਰੀਪਟ ਸ਼ਾਮਲ ਕਰਨ ਨਾਲ ਸਭ ਤੋਂ ਸਾਫ਼, ਸਭ ਤੋਂ ਸਹੀ ਕਲੋਨ ਮਿਲਦਾ ਹੈ।
3

ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

ਟੈਕਸਟ, ਜੋ ਕਿ ਤੁਸੀਂ ਕਲੋਨ ਵੌਇਸ ਵਿੱਚ ਬੋਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਲਿਖੋ ਜਾਂ ਚੇਪੋ। GPT-SoVITS ਚੀਨੀ, ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਅਤੇ ਕੈਂਟੋਨੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ, ਜਿਸ ਵਿੱਚ ਹੋਰ ਭਾਸ਼ਾ ਵਿੱਚ ਹਵਾਲਾ ਤੋਂ ਕ੍ਰਾਸ-ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਵੀ ਸ਼ਾਮਲ ਹੈ।
4

ਆਡੀਓ ਬਣਾਓ

ਸਾਡੇ GPU ਸਰਵਰਾਂ ਨੂੰ ਜਾਬ ਭੇਜਣ ਲਈ ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ । GPT-SoVITS ਮੱਧਮ ਗਤੀ ਉੱਤੇ ਵਧੀਆ ਕੁਆਲਟੀ ਦੀ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਲਈ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 25 ਕਰੈਡਿਟ ਬਿੱਲ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ।
5

API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

ਆਪਣੀ ਪੂਰੀ GPT-SoVITS ਆਡੀਓ ਨੂੰ ਫਾਇਲ ਵਾਂਗ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ TextToSpeechAI REST API ਨਾਲ api.texttospeechai.com ਉੱਤੇ ਉਤਪਾਦਨ ਵਰਕਫਲੋ ਲਈ ਆਟੋਮੈਟਿਕ ਬਣਾਓ।

GPT- ਸੋਵੀਟ API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "GPT\u002DSoVITS ਆਡੀਓ ਦੇ ਕੁਝ ਸਕਿੰਟਾਂ ਤੋਂ ਹੀ ਉੱਚ ਕੁਆਲਟੀ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਪੈਦਾ ਕਰਦਾ ਹੈ ।",
    "voice": "en_US-lessac-medium"
  }'

API ਡੌਕੂਮੈਂਟ ਪੜ੍ਹੋ ਆਪਣੀ API ਕੁੰਜੀ ਲਵੋ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

GPT-SoVITS ਇੱਕ state-of-the-art ਬੋਲੀ ਕਲੋਨਿੰਗ ਸਿਸਟਮ ਹੈ, ਜੋ ਕਿ GPT-style ਭਾਸ਼ਾ ਮਾਡਲਿੰਗ ਅਤੇ SoVITS ਬੋਲੀ ਬਦਲਣ ਨੂੰ ਜੋੜਦਾ ਹੈ । ਇਹ ਕੇਵਲ 3-10 ਸਕਿੰਟ ਦੇ ਰਿਫਰੈਂਡ ਆਡੀਓ ਤੋਂ ਹੀ ਬਹੁਤ ਹੀ ਕੁਦਰਤੀ ਬੋਲੀ ਕਲੋਨ ਬਣਾਉਦਾ ਹੈ ।

ਹਾਂ, GPT-SoVITS ਪੂਰੀ ਤਰ੍ਹਾਂ MIT ਲਾਈਸੈਂਸ ਨਾਲ ਹੈ - ਕੋਡ ਅਤੇ ਮਾਡਲ ਭਾਰ ਦੋਵੇਂ। ਇਹ ਬਿਨਾਂ ਕਿਸੇ ਪਾਬੰਦੀ ਦੇ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਮੁਫ਼ਤ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

GPT-SoVITS ਚੀਨੀ, ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਅਤੇ ਕੈਂਟੋਨੀਜ਼ ਲਈ ਸਹਾਇਕ ਹੈ। ਇਹ ਪਾਰ-ਭਾਸ਼ਾ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਵੀ ਸਹਾਇਕ ਹੈ - ਇੱਕ ਭਾਸ਼ਾ ਵਿੱਚ ਹਵਾਲਾ ਦਿਓ ਅਤੇ ਦੂਜੀ ਭਾਸ਼ਾ ਵਿੱਚ ਬੋਲੀ ਬਣਾਓ।

GPT-SoVITS ਲਗਾਤਾਰ ਉੱਚ ਕੁਆਲਟੀ ਵਾਲੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਮਾਡਲਾਂ ਵਿੱਚ ਰੈਂਕਿੰਗ ਕਰਦਾ ਹੈ । ਇਹ ਬਹੁਤੇ ਬਦਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਰਿਫਰੈਂਡ ਆਡੀਓ ਦੀ ਟਰਾਂਸਕਰੀਪਟ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ।

ਸਭ ਤੋਂ ਵਧੀਆ ਨਤੀਜਿਆਂ ਲਈ, ਇੱਕ ਹਵਾਲਾ ਆਡੀਓ ਕਲਿੱਪ ਅਤੇ ਇਸ ਦੇ ਪਾਠ ਟਰਾਂਸਕਰੀਪਟ ਦੋਵੇਂ ਦਿਓ । ਟਰਾਂਸਕਰੀਪਟ ਮਾਡਲ ਨੂੰ ਹਵਾਲਾ ਬੋਲੀ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ । ਟਰਾਂਸਕਰੀਪਟ ਤੋਂ ਬਿਨਾਂ, ਮਾਡਲ ਕੰਮ ਕਰਦਾ ਹੈ ਪਰ ਕੁਆਲਟੀ ਥੋੜ੍ਹੀ ਘੱਟ ਹੋ ਸਕਦੀ ਹੈ ।

GPT-SoVITS ਲਈ ਇੰਪੁੱਟ ਲੰਬਾਈ ਉੱਤੇ ਨਿਰਭਰ ਕਰਕੇ VRAM ਦੀ 4-8GB ਲੋੜ ਹੈ। ਅਨੁਕੂਲ ਕਾਰਗੁਜ਼ਾਰੀ ਲਈ6GB ਜਾਂ ਵੱਧ GPU ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। TextToSpeechAI ਉੱਤੇ ਮਾਡਲ ਸਾਡੇ GPU ਸਰਵਰਾਂ ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

GPT-SoVITS ਸਭ ਤੋਂ ਵੱਧ ਅਸਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਉਪਲੱਬਧ ਕਰਵਾਉਦਾ ਹੈ, ਇੱਕ ਛੋਟੇ ਹਵਾਲਾ ਕਲਿੱਪ ਤੋਂ ਟਿਮਬਰ, ਅੱਖਰਾਂ ਅਤੇ ਪਰੋਸੌਡੀ ਨੂੰ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਮੁੜ-ਉਪਜਾਈ ਕਰਦਾ ਹੈ। ਹਵਾਲਾ ਆਡੀਓ ਦੀ ਟਰਾਂਸਕਰੀਪਟ ਮੁਹੱਈਆ ਕਰਵਾਉਣ ਨਾਲ ਕੁਆਲਟੀ ਹੋਰ ਵੀ ਵੱਧ ਜਾਂਦੀ ਹੈ, ਕਲੋਨ ਨੂੰ ਸਰੋਤ ਸਪੀਕਰ ਤੋਂ ਅਣਜਾਣ ਬਣਾ ਦਿੰਦੀ ਹੈ।

GPT-SoVITS ਨੂੰ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ ਸਿਰਫ਼ 3-10 ਸਕਿੰਟ ਦੀ ਸਾਫ਼ ਰਿਫਰੈਂਸ ਆਡੀਓ ਦੀ ਲੋੜ ਹੈ। ਇੱਕ ਛੋਟਾ, ਸਾਫ਼ ਸੈਪਲ ਘੱਟੋ-ਘੱਟ ਬੈਕਗਰਾਊਂਡ ਨੋਜ਼ ਨਾਲ ਵਧੀਆ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ, ਅਤੇ ਮਿਲਦੀ ਟਰਾਂਸਕਰੀਪਟ ਸ਼ਾਮਲ ਕਰਨ ਨਾਲ ਸਹੀਤਾ ਹੋਰ ਵਧਦੀ ਹੈ।

GPT- SoVITS ਮੱਧਮ ਗਤੀ ਨਾਲ ਚੱਲਦਾ ਹੈ ਅਤੇ ਵਧੀਆ, ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਦਿੰਦਾ ਹੈ । ਇਹ ਹਲਕੇ ਮਾਡਲਾਂ ਜਿਵੇਂ ਕਿ Piper ਜਾਂ Kokoro ਨਾਲੋਂ ਥੋੜ੍ਹੀ ਗਤੀ ਬਦਲਦਾ ਹੈ, ਪਰ ਇਸ ਨਾਲ ਵਧੇਰੇ ਕੁਦਰਤੀ, ਸਪੱਸ਼ਟ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਮਿਲਦੀ ਹੈ ।

GPT-SoVITS ਇੱਕ ਪ੍ਰੀਮੀਅਮ-ਟਾਇਰ ਮਾਡਲ ਹੈ, ਜਿਸ ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 25 ਕਰੈਡਿਟ ਹੈ। ਇਹ ਸਟੈਂਡਰਡ ਟਾਇਰ (10 ਕਰੈਡਿਟ) ਤੋਂ ਉੱਪਰ ਹੈ ਪਰ Tortoise ਅਤੇ StyleTTS2 (50 ਕਰੈਡਿਟ) ਵਰਗੇ ਅਲਟਰਾ-ਟਾਇਰ ਮਾਡਲਾਂ ਤੋਂ ਹੇਠਾਂ ਹੈ।

ਦੋਵੇਂ ਪ੍ਰੀਮੀਅਮ- ਟਾਇਰ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਇੰਜਣ ਹਨ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਲਾਇਸੈਂਸ ਪ੍ਰਾਪਤ ਹਨ । GPT- SoVITS ਨੂੰ ਕੱਚੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਅਤੇ ਪਾਰ- ਭਾਸ਼ਾ ਪਰੋਸੈਡੀ ਉੱਤੇ ਜਿੱਤ ਮਿਲਦੀ ਹੈ, ਜਦ ਕਿ CosyVoice2 (Apache 2.0) ਬਹੁ- ਭਾਸ਼ਾ ਕਵਰੇਜ ਦਿੰਦਾ ਹੈ । ਦੋਵੇਂ ਮੁਫਤ TextToSpeechAI ਉੱਤੇ ਵਰਤੋਂ ਅਤੇ ਆਪਣੀ ਟਿਕਾਣਾ ਆਵਾਜ਼ ਨਾਲ ਸਭ ਤੋਂ ਵਧੀਆ ਮਿਲਦੀ ਇੱਕ ਚੁਣੋ ।

ਹਾਂ, ਮੁਫਤ TextToSpeechAI ਅਕਾਊਂਟ ਲਈ ਰਜਿਸਟਰਡ ਹੋਵੋ ਤਾਂ ਇੱਕ ਵਾਰੀ ਸਟਾਰਟ ਕਰੈਡਿਟ ਮਿਲੇਗਾ, ਜਾਂ ਡੀਮੋ ਨੂੰ ਅਕਾਊਂਟ ਦੇ ਬਗੈਰ GPT-SoVITS ਸੁਣਨ ਲਈ ਵਰਤੋਂ । ਇਹ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਅਤੇ ਕਰੈਡਿਟ ਪੈਕ ਖਰੀਦਣ ਤੋਂ ਪਹਿਲਾਂ ਕੁਆਲਟੀ ਟੈਸਟ ਕਰਨ ਲਈ ਕਾਫੀ ਹੈ ।

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 5
GPU VRAM 4-8GB
Credits/1000 chars 25

Try GPT- ਸੋਵੀਟ Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

GPT- ਸੋਵੀਟ

ਬਾਰੇ GPT- ਸੋਵੀਟ

ਮੁੱਖ ਫੀਚਰ

ਕੁਝ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ

ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਸੰਸਲੇਸ਼ਣ

ਸਭ ਤੋਂ ਉੱਚੀ ਕੁਆਲਟੀ

ਖੋਲ੍ਹੋ ਸਰੋਤ

ਵਰਤੋਂ ਕੇਸ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ GPT- ਸੋਵੀਟ

ਮੁਫਤ ਅਕਾਊਂਟ ਬਣਾਓ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

GPT-SoVITS ਚੁਣੋ ਅਤੇ ਇੱਕ ਹਵਾਲਾ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ

ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

ਆਡੀਓ ਬਣਾਓ

API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

GPT- ਸੋਵੀਟ API

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

GPT-SoVITS ਕੀ ਹੈ?

ਕੀ GPT-SoVITS ਵਪਾਰਕ ਤੌਰ ਉੱਤੇ ਵਰਤਣ ਲਈ ਮੁਫ਼ਤ ਹੈ?

ਕਿਹੜੀਆਂ ਭਾਸ਼ਾਵਾਂ GPT-SoVITS ਸਹਿਯੋਗੀ ਹਨ?

GPT-SoVITS ਦੀ ਹੋਰ ਬੋਲੀ ਕਲੋਨਿੰਗ ਮਾਡਲਾਂ ਨਾਲ ਤੁਲਨਾ ਕਿਵੇਂ ਕੀਤੀ ਜਾਵੇ?

ਰਿਫਰੈਸ਼ਨ ਟਰਾਂਸਕਰੀਪਟ ਕੀ ਹੈ?

ਕਿੰਨੀ GPU ਮੈਮੋਰੀ GPT-SoVITS ਨੂੰ ਲੋੜੀਦੀ ਹੈ?

GPT-SoVITS ਵੌਇਸ ਕਲੋਨਿੰਗ ਕਿੰਨੀ ਚੰਗੀ ਹੈ?

ਕਿੰਨੀ ਆਡੀਓ GPT-SoVITS ਨੂੰ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ ਲੋੜੀਦੀ ਹੈ?

GPT-SoVITS ਕਿੰਨੀ ਤੇਜ਼ ਹੈ ਅਤੇ ਕੀ ਕੁਆਲਟੀ ਦੀ ਮੈਂ ਉਮੀਦ ਕਰ ਸਕਦਾ ਹਾਂ?

ਕਿੰਨੇ ਕਰੈਡਿਟ GPT-SoVITS TextToSpeechAI ਉੱਤੇ ਖਰਚ ਕਰਦਾ ਹੈ?

GPT-SoVITS ਅਤੇ CosyVoice2 - ਕਿਹੜਾ ਮੈਂ ਚੁਣਨਾ ਚਾਹੀਦਾ ਹੈ?

ਕੀ ਮੈਂ GPT-SoVITS ਮੁਫਤ ਲਈ ਵਰਤ ਸਕਦਾ ਹਾਂ?

Technical Specs

Try GPT- ਸੋਵੀਟ Now

Other TTS Engines

ਬਾਰ

ਚੈਟਰਬਾਕਸ

ਕੋਸੀ- ਆਵਾਜ਼2Name