TTS ਸਟਾਇਲ 2

Ultra

ਸਟਾਇਲ ਟਰਾਂਸਫਰ ਨਾਲ ਮਨੁੱਖੀ- ਪੱਧਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀName

Moderate ਗਤੀ
Excellent ਕੁਆਲਟੀ
ਹਾਂ ਕਲੋਨਿੰਗ
1 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ TTS ਸਟਾਇਲ 2

s. StyleTTS 2 is the first TTS system to use the

ਮੁੱਖ ਫੀਚਰ

ਮਨੁੱਖੀ- ਪੱਧਰ ਕੁਆਲਟੀ

ਅੱਖਾਂ ਬੰਦ ਟੈਸਟ ਵਿੱਚ ਮਨੁੱਖੀ ਰਿਕਾਰਡਿੰਗ ਤੋਂ ਅਲੱਗ ਬੋਲੀ ਬਣਾਓ ।

ਸਟਾਇਲ ਟਰਾਂਸਫਰ

ਕਿਸੇ ਵੀ ਰਿਫਰੈਸ਼ਨ ਆਡੀਓ ਸੈਮਪਲ ਤੋਂ ਬੋਲਣ ਸਟਾਇਲ ਟਰਾਂਸਫਰ ਕਰੋ ।

ਕੁਦਰਤੀ ਪਰੋਸੈੱਸ

ਡਿਫਿਊਸ਼ਨ ਅਧਾਰਿਤ ਮਾਡਲਿੰਗ ਨਾਲ ਸੰਪੂਰਨ ਰੀਥਮ, ਸਟ੍ਰੈਸ ਅਤੇ ਇੰਟੋਨੇਸ਼ਨ।

ਬੋਲੀ ਕਲੋਨਿੰਗ

ਅਸਾਧਾਰਨ ਸਹੀਤਾ ਅਤੇ ਕੁਦਰਤੀਤਾ ਨਾਲ ਕਲੋਨ ਆਵਾਜ਼ਾਂ ਬਣਾਓ ।

ਤੇਜ਼ ਅੰਦਾਜ਼ਾ

ਕੁਆਲਟੀ ਨੂੰ ਕਾਇਮ ਰੱਖਦੇ ਹੋਏ ਆਟੋਰਿਗਰੇਸ਼ਨ ਮਾਡਲਾਂ ਨਾਲੋਂ ਤੇਜ਼ ਹੈ ।

ਖੋਲ੍ਹੋ ਸਰੋਤ

MIT ਲਾਈਸੈਂਸ ਪੂਰੇ ਵਪਾਰਕ ਵਰਤੋਂ ਅਧਿਕਾਰਾਂ ਨਾਲ ਹੈ ।

ਵਰਤੋਂ ਕੇਸ

ਪ੍ਰੀਮੀਅਮ ਆਡੀਓਬੁੱਕਾਂ ਪਰੋਫੈਸ਼ਨਲ ਬੋਲੀ ਫਿਲਮ ਅਤੇ ਟੀਵੀ ਨਿਰਮਾਣName ਉੱਚ- ਅੰਤ ਐਡਵਰਟਾਈਜ਼ਿੰਗ ਪੋਡਕਾਸਟ ਨਿਰਮਾਣ ਬੋਲੀ ਐਕਸ਼ਨ

TTS ਸਟਾਇਲ 2 Voices

View All 6
StyleTTS2 Default
EN
StyleTTS2 Expressive
EN
StyleTTS2 Fast
EN
StyleTTS2 Natural
EN
StyleTTS2 Neutral
EN
StyleTTS2 Quality
EN

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ TTS ਸਟਾਇਲ 2

  1. 1

    ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਚਲਾਓ

    ਸਟਾਰਟਅੱਪ ਕ੍ਰੈਡਿਟ ਲੈਣ ਲਈ ਮੁਫਤ TextToSpeechAI ਅਕਾਊਂਟ ਬਣਾਓ, ਜਾਂ ਘਰ ਪੇਜ਼ ਡੈਮੋ ਵਰਤੋਂ StyleTTS2 ਨੂੰ ਲਾਗਇਨ ਕੀਤੇ ਬਿਨਾਂ ਸੁਣਨ ਲਈ ।

  2. 2

    ਸਟਾਇਲTTS2 ਇੰਜਣ ਚੁਣੋ

    ਆਵਾਜ਼ ਲਾਇਬਰੇਰੀ ਵਿੱਚੋਂ ਇੱਕ StyleTTS2 ਆਵਾਜ਼ ਚੁਣੋ । ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ, 10- 30 ਸਕਿੰਟ ਦਾ ਹਵਾਲਾ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ StyleTTS2 ਇਸ ਦਾ ਸਟਾਇਲ ਟਰਾਂਸਫਰ ਕਰੇਗਾ ।

  3. 3

    ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

    ਸਕ੍ਰਿਪਟ ਜੋ ਤੁਸੀਂ ਬੋਲਣੀ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਚੇਪੋ ਜਾਂ ਟਾਈਪ ਕਰੋ । StyleTTS2 ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਵਧੀਆ ਹੈ ਅਤੇ ਲੰਬੇ ਪਾਠ ਵਿੱਚ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ, ਸਤਰ ਅਤੇ ਝਲਕ ਦਿੰਦਾ ਹੈ ।

  4. 4

    ਆਡੀਓ ਬਣਾਓ

    ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ ਅਤੇ TextToSpeechAI GPU ਉੱਤੇ ਤੁਹਾਡਾ StyleTTS2 ਆਡੀਓ ਪੇਸ਼ ਕਰੇਗਾ । ਅਲਟਰਾ- ਟਾਇਰ StyleTTS2 ਪ੍ਰਤੀ 1000 ਅੱਖਰ 50 ਕਰੈਡਿਟ ਦੀ ਕੀਮਤ ਹੈ ।

  5. 5

    API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

    ਮੁਕੰਮਲ StyleTTS2 ਆਡੀਓ MP3, WAV ਜਾਂ OGG ਵਾਂਗ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਟੋਮੈਟਿਕ ਤਿਆਰੀ ਲਈ ਆਪਣੀ StyleTTS2 ਆਵਾਜ਼ ਨਾਲ TextToSpeechAI API ਕਾਲ ਕਰੋ ।

TTS ਸਟਾਇਲ 2 API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "StyleTTS2 ਬੋਲੀ ਇੰਨੀ ਕੁਦਰਤੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਇਹ ਪਰੋਫੈਸ਼ਨਲ ਮਨੁੱਖੀ ਰਿਕਾਰਡਿੰਗ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰਦੀ ਹੈ ।",
    "voice": "styletts2-default"
  }'

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

StyleTTS2 ਇੱਕ state- of- the- art ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਮਨੁੱਖੀ- ਪੱਧਰ ਦੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ । ਇਹ ਸਟਾਇਲ ਡਿਫਿਊਸ਼ਨ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਅੱਖਾਂ ਨਾ ਵੇਖਣ ਵਾਲੀਆਂ ਸੁਣਨ ਟੈਸਟ ਵਿੱਚ ਅਸਲੀ ਮਨੁੱਖੀ ਰਿਕਾਰਡਿੰਗ ਤੋਂ ਅਣਜਾਣ ਬੋਲੀ ਪੈਦਾ ਕਰਨ ਲਈ ਹੈ । ਤੁਸੀਂ StyleTTS2 ਨੂੰ TextToSpeechAI ਉੱਤੇ ਮੁਫ਼ਤ ਵਿੱਚ ਵਰਤ ਸਕਦੇ ਹੋ ।

ਸਟਾਇਲTTS2 TextToSpeechAI ਉੱਤੇ ਉਪਲੱਬਧ ਸਭ ਤੋਂ ਉੱਚ ਕੁਆਲਟੀ TTS ਆਡੀਓ ਤਿਆਰ ਕਰਦਾ ਹੈ । ਰਸਮੀ ਮੁਲਾਂਕਣ ਵਿੱਚ ਇਹ MOS (Mean Opinion Score) ਟੈਸਟ ਉੱਤੇ ਮਨੁੱਖੀ- ਪੱਧਰ ਰੇਟਿੰਗ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਸੁਣਨ ਵਾਲੇ ਅਕਸਰ ਇੱਕ ਅਸਲੀ ਮਨੁੱਖੀ ਸਪੀਕਰ ਤੋਂ ਵੱਖ ਨਹੀਂ ਕਰ ਸਕਦੇ ਹਨ । ਇਸ ਲਈ ਇਹ ਸਾਡੇ ਅਲਟਰਾ ਟਾਇਰ ਵਿੱਚ Tortoise ਦੇ ਨਾਲ ਹੈ ।

ਹਾਂ, StyleTTS2 ਸਟਾਇਲ ਟਰਾਂਸਫਰ ਰਾਹੀਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਸਿਰਫ਼ ਟਿਮਬਰ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਰਿਫਰੈਸ਼ਨ ਕਲਿੱਪ ਤੋਂ ਬੋਲੀ ਪੈਟਰਨ, ਰਿਦਮ ਅਤੇ ਭਾਵਨਾਤਮਕ ਗੁਣ ਵੀ ਕੱਢਦਾ ਹੈ । ਸਭ ਤੋਂ ਸਹੀ StyleTTS2 ਕਲੋਨ ਲਈ 10- 30 ਸਕਿੰਟ ਸਾਫ਼ ਆਡੀਓ ਦਿਓ ।

ਹਾਂ । StyleTTS2 MIT ਲਾਈਸੈਂਸ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਕੋਈ ਰਿਆਇਤ ਨਾ ਹੋਣ ਕਰਕੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਆਡੀਓਬੁੱਕ, ਐਡਵਰਡ, ਫਿਲਮ ਅਤੇ ਹੋਰ ਪਰੋਫੈਸ਼ਨਲ StyleTTS2 ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ, ਜਿੱਥੇ ਕਿ ਅਧਿਕਾਰ ਮਹੱਤਵਪੂਰਨ ਹਨ ।

StyleTTS2 ਮੁੱਖ ਤੌਰ ਉੱਤੇ ਅੰਗਰੇਜ਼ੀ ਲਈ ਸਹਾਇਕ ਹੈ, ਕਿਉਂਕਿ ਮਾਡਲ ਅੰਗਰੇਜ਼ੀ ਡਾਟਾ- ਸੈੱਟ ਉੱਤੇ ਟਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ । ਜੇਕਰ ਤੁਹਾਨੂੰ ਕਈ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਇੱਕੋ ਕੁਆਲਟੀ ਦੀ ਲੋੜ ਹੈ ਤਾਂ TextToSpeechAI ਉੱਤੇ F5- TTS ਵਧੀਆ ਹੈ, ਜਦੋਂ ਕਿ ਅਜੇ ਵੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਸਟਾਇਲTTS2 ਦੀ ਮੱਧਮ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਹੈ । ਇਹ ਆਟੋਰਿਗਰੇਸ਼ਨਲ ਮਾਡਲਾਂ ਜਿਵੇਂ ਕਿ ਟੋਰਟੋਇਸ ਨਾਲੋਂ ਬਹੁਤ ਤੇਜ਼ ਹੈ, ਪਰ ਹਲਕੇ ਇੰਜਣਾਂ ਜਿਵੇਂ ਕਿ ਪਾਈਪਰ ਨਾਲੋਂ ਹੌਲੀ ਹੈ । ਇਸ ਦੀ ਪ੍ਰੀਮੀਅਮ ਕੁਆਲਟੀ ਅਤੇ ਕੰਪਿਊਟਿੰਗ ਲਾਗਤ ਕਰਕੇ, ਸਟਾਇਲTTS2 ਦੀ ਕੀਮਤ ਇੱਕ ਰੀਅਲ- ਟਾਈਮ ਮਾਡਲ ਵਾਂਗ ਨਹੀਂ, ਬਲਕਿ ਸਾਡੀ ਅਲਟਰਾ ਟਾਇਰ ਵਿੱਚ ਹੈ ।

ਸਟਾਇਲTTS2 ਨੂੰ ਅੰਦਾਜ਼ੇ ਲਈ ਲਗਭਗ 4-6GB VRAM ਦੀ ਲੋੜ ਹੈ । ਇਹ ਬਾਰਕ ਜਾਂ ਟੋਰਟੋਇਸ ਨਾਲੋਂ ਵਧੇਰੇ ਮੈਮੋਰੀ- ਕੁਸ਼ਲ ਹੈ ਅਤੇ ਉੱਚ ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਦਿੰਦਾ ਹੈ । TextToSpeechAI ਉੱਤੇ ਸਭ ਸਟਾਇਲTTS2 ਪਰੋਸੈਸਿੰਗ ਸਾਡੇ GPU ਉੱਤੇ ਚੱਲਦੀ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ ।

StyleTTS2 ਇੱਕ ਅਲਟਰਾ- ਟਾਇਰ ਮਾਡਲ ਹੈ ਅਤੇ TextToSpeechAI ਉੱਤੇ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 50 ਕ੍ਰੈਡਿਟ ਦੀ ਕੀਮਤ ਹੈ । ਇਹ ਪ੍ਰੀਮੀਅਮ ਕੀਮਤ ਇਸ ਦੀ ਮਨੁੱਖੀ- ਪੱਧਰ ਦੀ ਕੁਆਲਟੀ ਅਤੇ GPU ਸਰੋਤਾਂ ਦੀ ਲੋੜ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ । ਸਟੈਂਡਰਡ ਮਾਡਲ ਜਿਵੇਂ ਕਿ Piper ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 10 ਕ੍ਰੈਡਿਟ ਹੈ ।

ਜਦੋਂ ਅੰਗਰੇਜ਼ੀ ਆਡੀਓ ਕੁਆਲਟੀ ਸਭ ਤੋਂ ਵੱਧ ਤਰਜੀਹ ਹੋਵੇ ਅਤੇ ਤੁਸੀਂ ਸਭ ਤੋਂ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਨਤੀਜਾ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਸਟਾਇਲTTS2 ਚੁਣੋ । ਜਦੋਂ ਤੁਹਾਨੂੰ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਤੇਜ਼ ਬਹੁ- ਭਾਸ਼ਾ ਸੰਸਲੇਸ਼ਣ ਦੀ ਲੋੜ ਹੋਵੇ ਤਾਂ F5- TTS ਚੁਣੋ । ਦੋਵੇਂ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹਨ, ਪਰ ਸਟਾਇਲTTS2 ਅਲਟਰਾ ਟਾਇਰ (50 ਕਰੈਡਿਟ) ਹੈ ਅਤੇ F5- TTS ਪ੍ਰੀਮੀਅਮ ਟਾਈਰ (25 ਕਰੈਡਿਟ) ਹੈ ।

StyleTTS2 24kHz ਉੱਤੇ ਉੱਚ ਕੁਆਲਟੀ ਆਡੀਓ ਤਿਆਰ ਕਰਦਾ ਹੈ । TextToSpeechAI ਰਾਹੀਂ ਤੁਸੀਂ MP3, WAV ਜਾਂ OGG ਦੇ ਰੂਪ ਵਿੱਚ ਨਤੀਜਾ ਡਾਊਨਲੋਡ ਕਰ ਸਕਦੇ ਹੋ, ਅਤੇ ਅਸੀਂ ਉੱਚ ਕੁਆਲਟੀ ਇੰਕੋਡਿੰਗ ਵਰਤਦੇ ਹਾਂ ਤਾਂ ਕਿ StyleTTS2 ਦੀ ਉੱਚ ਕੁਆਲਟੀ ਅੰਤਮ ਫਾਇਲ ਵਿੱਚ ਸੰਭਾਲੀ ਜਾ ਸਕੇ ।

ਹਾਂ । StyleTTS2 ਬੋਲੀ- ਰੇਟ ਅਡਜੱਸਟਮੈਂਟ ਲਈ ਸਹਾਇਕ ਹੈ, ਅਤੇ ਇਸ ਦਾ ਸਟਾਇਲ- ਟਰਾਂਸਫਰ ਡਿਜ਼ਾਇਨ ਤੁਹਾਨੂੰ ਵੱਖਰੇ ਰਿਫਰੈਸ਼ਨ ਕਲਿੱਪ ਚੁਣ ਕੇ ਪਰੋਸੌਡੀ ਬਣਾਉਣ ਦਿੰਦਾ ਹੈ । ਤੁਸੀਂ ਜੋ ਵੀ ਰਿਦਮ ਅਤੇ ਭਾਵਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਉਸ ਨਾਲ ਆਡੀਓ ਚੁਣ ਕੇ StyleTTS2 ਡਿਲੀਵਰੀ ਉੱਤੇ ਚੰਗਾ ਕੰਟਰੋਲ ਪ੍ਰਾਪਤ ਕਰੋਗੇ ।

ਸਾਡੀ ਲਾਇਬਰੇਰੀ ਵਿੱਚੋਂ ਇੱਕ StyleTTS2 ਆਡੀਓ ਚੁਣੋ ਜਾਂ ਕਲੋਨ ਆਡੀਓ ਬਣਾਉਣ ਲਈ ਰਿਫਰੈਸ਼ਨ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰੋ, ਫਿਰ ਆਪਣੀ API ਮੰਗ ਵਿੱਚ ਉਸ ਆਡੀਓ ਨੂੰ ਹਵਾਲਾ ਦਿਓ । TextToSpeechAI ਸਭ GPU ਪਰੋਸੈਸਿੰਗ ਹੈਂਡਲ ਕਰਦਾ ਹੈ ਅਤੇ ਤੁਹਾਡੀ ਪ੍ਰੀਮੀਅਮ StyleTTS2 ਆਡੀਓ ਨਾਲ ਡਾਊਨਲੋਡ URL ਦਿੰਦਾ ਹੈ ।

Technical Specs

  • Generation Speed Moderate
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 4-6GB
  • Credits/1000 chars 50

Try TTS ਸਟਾਇਲ 2 Now

Generate your first audio free. No credit card required.

Start Free