ਖੇਤਰ

Ultra

ਭਾਵਨਾ ਅਤੇ ਸਟਾਇਲ ਕੰਟਰੋਲ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗName

Medium ਗਤੀ
Excellent ਕੁਆਲਟੀ
ਹਾਂ ਕਲੋਨਿੰਗ
5 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ ਖੇਤਰ

s. It supports text-to-speech clones from 5-30 seconds of reference audio and can modulate the emotional tone of generated audios to create voices. It supports text-to-speech clones from 5-30 seconds of reference audio and can modulate the emotional tone of generated audios to create voices. It supports text-to-speech clones from 5-30 seconds

ਮੁੱਖ ਫੀਚਰ

ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ

ਬੋਲੀ ਦੀਆਂ ਭਾਵਨਾਵਾਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰੋ: ਖੁਸ਼ੀ, ਦੁੱਖ, ਗੁੱਸਾ, ਭੈਅ, ਹੈਰਾਨੀ, ਝਿਜਕ ਅਤੇ ਨਿਊਟਰਲ।

ਬੋਲੀ ਕਲੋਨਿੰਗ

5-30 ਸਕਿੰਟ ਦੇ ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਕਲੋਨ ਕਰੋ ।

ਐਕਸਪ੍ਰੈੱਸਿਵ ਸਪੀਚ

1.6B ਪੈਰਾਮੀਟਰਾਂ ਨਾਲ ਅਤਿਅੰਤ ਭਾਵਨਾਤਮਕ ਢੰਗ ਨਾਲ ਬੋਲਣ ਦੀ ਸਮਰੱਥਾ ਹੈ।

ਬਹੁ- ਭਾਸ਼ਾ

ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ, ਫਰਾਂਸੀਸੀ ਅਤੇ ਜਰਮਨ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਵਰਤੋਂ ਕੇਸ

ਭਾਵਨਾਤਮਕ ਤੌਰ ਉੱਤੇ ਪ੍ਰਗਟ ਸਮੱਗਰੀ ਬਣਾਉਣਾ ਈਮੋਸ਼ਨ ਨਾਲ ਖੇਡ ਅੱਖਰ ਆਵਾਜ਼ ਆਡੀਓਬੁੱਕ ਨਾਂਅ ਇੰਟਰਐਕਟਿਵ ਬੋਲੀ ਅਨੁਭਵ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ ਖੇਤਰ

  1. 1

    ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

    ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਲੈਣ ਲਈ ਮੁਫਤ TextToSpeechAI ਖਾਤਾ ਬਣਾਓ, ਜਾਂ ਜ਼ੋਨੋਸ ਨੂੰ ਤੁਰੰਤ ਵਰਤਣ ਲਈ ਕੋਈ ਰਜਿਸਟਰ ਡੀਮੋ ਨਾ ਵਰਤੋਂ।

  2. 2

    ਜ਼ੋਨੋਸ ਇੰਜਣ ਚੁਣੋ

    ਆਵਾਜ਼ ਅਤੇ ਮਾਡਲ ਚੋਣਕਾਰ ਤੋਂ ਜ਼ੋਨੋਸ ਚੁਣੋ । ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ, 5- 30 ਸਕਿੰਟ ਸਾਫ਼ ਰਿਫਰੈਂਸ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰੋ ਤਾਂ ਕਿ ਜ਼ੋਨੋਸ ਸਪੀਕਰ ਨਾਲ ਮਿਲਾ ਸਕੇ ।

  3. 3

    ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

    ਸਕ੍ਰਿਪਟ, ਜੋ ਕਿ ਤੁਸੀਂ ਬੋਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਲਿਖੋ ਜਾਂ ਚੇਪੋ । ਜ਼ੋਨੋਸ ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ, ਫਰੈਂਚ ਅਤੇ ਜਰਮਨ ਵਿੱਚ ਕੰਮ ਕਰਦਾ ਹੈ ।

  4. 4

    ਇੱਕ ਈਮੋਸ਼ਨ ਚੁਣੋ ਅਤੇ ਬਣਾਓ

    ਜ਼ੋਨੋ ਈਮੋਸ਼ਨ ਵਿੱਚੋਂ ਇੱਕ ਚੁਣੋ - ਨਿਊਟਰਲ, ਖੁਸ਼ੀ, ਦੁੱਖ, ਗੁੱਸਾ, ਭੈਅ, ਹੈਰਾਨੀ ਜਾਂ ਝਿਜਕ - ਅਤੇ ਫਿਰ ਉਸ ਹਾਲਤ ਵਿੱਚ ਬੋਲੀ ਬਣਾਉਣ ਲਈ ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ ।

  5. 5

    API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

    ਆਡੀਓ ਨੂੰ ਮੁੜ ਚਲਾਓ ਅਤੇ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਟੋਮੈਟਿਕ ਵਰਕਫਲੋ ਲਈ TextToSpeechAI REST API ਰਾਹੀਂ ਇੱਕੋ ਹੀ ਜ਼ੋਨੋਸ ਇੰਜਣ ਨੂੰ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਕਾਲ ਕਰੋ।

ਖੇਤਰ API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ਜ਼ੋਨੋਸ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਭਾਵਨਾਤਮਕ ਕੰਟਰੋਲ ਨਾਲ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਭਾਵਨਾਤਮਕ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ।",
    "voice": "en_US-lessac-medium"
  }'

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

ਜ਼ੋਨੋਸ ਜ਼ੀਫਰਾ ਦਾ 1.6B ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ । ਇਹ ਫ਼ਾਇਨ- ਗ੍ਰੇਨਡ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ- ਭਰੋਸੇਯੋਗਤਾ ਵਾਲੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਪੱਸ਼ਟ ਬੋਲੀ ਪੈਦਾ ਕਰਨ ਵਿੱਚ ਮਾਹਰ ਹੈ । TextToSpeechAI ਉੱਤੇ ਇਹ ਸਭ ਤੋਂ ਵੱਧ ਨਜ਼ਰੀਏ, ਭਾਵਨਾਤਮਕ ਰੀਚ ਆਡੀਓ ਲਈ ਇੱਕ ਅਲਟਰਾ- ਟਾਇਰ ਇੰਜਣ ਵਾਂਗ ਚੱਲਦਾ ਹੈ ।

ਹਾਂ। ਜ਼ੋਨੋਸ ਨੂੰ ਕੋਡ ਅਤੇ ਮਾਡਲ ਭਾਰ ਦੋਹਾਂ ਲਈ ਅਪਾਚੀ 2.0 ਲਾਈਸੈਂਸ ਹੇਠ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਇਸ ਲਈ ਇਸ ਨੂੰ ਵਪਾਰਕ ਉਤਪਾਦਾਂ ਵਿੱਚ ਬਿਨਾਂ ਕਿਸੇ ਯੋਗਦਾਨ ਜਾਂ ਗੈਰ-ਵਪਾਰਕ ਪਾਬੰਦੀਆਂ ਦੇ ਮੁਫ਼ਤ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ ਭੁਗਤਾਨ ਐਪਲੀਕੇਸ਼ਨ, ਕਲਾਇਟ ਕੰਮ ਅਤੇ ਮੁਦਰਾ ਸਮੱਗਰੀ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ।

ਜ਼ੋਨੋਸ ਸੱਤ ਭਾਵਨਾਤਮਕ ਹਾਲਤਾਂ - ਨਿਊਟਰਲ, ਖੁਸ਼ੀ, ਦੁੱਖ, ਗੁੱਸਾ, ਭੈੜੀ, ਹੈਰਾਨੀ ਅਤੇ ਡਰ - ਨੂੰ ਵੇਖਾਉਦਾ ਹੈ, ਜੋ ਕਿ ਤੁਸੀਂ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਚੁਣਦੇ ਹੋ । ਮਾਡਲ ਚੁਣੇ ਭਾਵਨਾਵਾਂ, ਤੱਤ, ਗਤੀ ਅਤੇ ਅਵਾਜ਼ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ, ਤਾਂ ਕਿ ਇੱਕੋ ਸਤਰ ਖੁਸ਼ ਜਾਂ ਗੁੱਸੇ ਵਿੱਚ ਸੁਣਾਈ ਦੇਵੇ । ਇਹ ਜ਼ੋਨੋਸ ਨੂੰ ਖਾਸ ਹਾਲਤ ਦੀ ਲੋੜ ਵਾਲੇ ਅੱਖਰ ਅਤੇ ਗੱਲਬਾਤ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ ।

ਜ਼ੋਨੋਸ ਸੱਤ ਭਾਵਨਾ ਚੋਣਾਂ ਲਈ ਸਹਾਇਕ ਹੈ: ਨਿਊਟਰਲ, ਖੁਸ਼ੀ, ਦੁੱਖ, ਗੁੱਸਾ, ਭੈਅ, ਹੈਰਾਨੀ ਅਤੇ ਝਿਜਕ। ਤੁਸੀਂ ਹਰੇਕ ਪੀੜ੍ਹੀ ਲਈ ਇੱਕ ਚੁਣੋ ਤਾਂ ਕਿ ਪੂਰੇ ਕਲਿੱਪ ਦਾ ਭਾਵਨਾਤਮਕ ਟੋਨ ਸੈੱਟ ਕੀਤਾ ਜਾ ਸਕੇ।

ਹਾਂ । ਜ਼ੋਨੋਸ ਸਿਰਫ 5- 30 ਸਕਿੰਟ ਦੇ ਰਿਫਰੈਸ਼ਨ ਆਡੀਓ ਤੋਂ ਹੀ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਦਾ ਹੈ, ਸਪੀਕਰ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਬਾਹਰ ਕੱਢਦਾ ਹੈ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਨਵੀਂ ਬੋਲੀ ਵਿੱਚ ਮੁੜ- ਤਿਆਰ ਕਰਦਾ ਹੈ । ਤੁਸੀਂ ਕਲੋਨਿੰਗ ਨੂੰ ਸੱਤ ਈਮੋਸ਼ਨਾਂ ਵਿੱਚੋਂ ਕਿਸੇ ਨਾਲ ਜੋੜ ਸਕਦੇ ਹੋ ਤਾਂ ਕਿ ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਖੁਸ਼, ਗੁੱਸੇ ਵਿੱਚ ਜਾਂ ਭੈੜੀ ਲੱਗੇ ।

ਜ਼ੋਨੋਸ ਪੰਜ ਭਾਸ਼ਾਵਾਂ ਹੈਂਡਲ ਕਰਦਾ ਹੈ: ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ, ਫਰੈਂਚ ਅਤੇ ਜਰਮਨ। ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਬੋਲੀ ਕਲੋਨਿੰਗ ਇਨ੍ਹਾਂ ਸਭ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਕੰਮ ਕਰਦੀ ਹੈ।

ਜ਼ੋਨੋਸ ਮੱਧਮ ਗਤੀ ਨਾਲ ਚੱਲਦਾ ਹੈ, ਕਿਉਂਕਿ ਇਸ ਦਾ 1.6B ਪੈਰਾਮੀਟਰ ਸਾਈਜ਼ ਹੈ, ਜੋ ਕਿ ਵਧੀਆ, ਉੱਚ- ਭਾਵਨਾਤਮਕ ਆਉਟਪੁੱਟ ਲਈ ਕੱਚੇ ਟਰੱਸਟਪਟ ਲਈ ਬਦਲਦਾ ਹੈ। ਕੁਆਲਟੀ ਭਾਵਨਾਤਮਕ ਅਤੇ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਹੈ, ਇਸ ਲਈ ਇਹ ਬਾਕਸ ਰੀਅਲ- ਟਾਈਮ ਜਨਰੇਸ਼ਨ ਦੀ ਬਜਾਏ ਆਡੀਓ ਦੀ ਅੰਤਮ ਉਤਪਾਦਨ ਲਈ ਢੁੱਕਵਾਂ ਹੈ।

ਜ਼ੋਨੋਸ ਨੂੰ ਆਪਣੇ 1.6B ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਲਈ 8GB ਜਾਂ ਵੱਧ VRAM ਦੀ ਲੋੜ ਹੈ। ਇੱਕ GPU, ਜਿਸ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ 10GB ਹੈ, ਨੂੰ ਸੁਵਿਧਾਜਨਕ ਕਾਰਵਾਈ ਲਈ ਸਲਾਹ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਜਦੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨੂੰ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ। TextToSpeechAI ਉੱਤੇ ਇਹ ਸਭ ਸਾਡੇ GPU ਬੈਕਐਂਡ ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

ਜ਼ੋਨੋਸ ਇੱਕ ਅਲਟਰਾ- ਟਾਇਰ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 50 ਕਰੈਡਿਟ ਨਾਲ ਬਿਲਡ ਕੀਤਾ ਜਾਂਦਾ ਹੈ । ਅਲਟਰਾ ਟਾਇਰ ਇਸ ਦੇ ਵੱਡੇ ਮਾਡਲ ਅਤੇ ਅਦਾਇਗੀ ਭਾਵਨਾ ਅਤੇ ਕਲੋਨਿੰਗ ਸਮਰੱਥਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਸਟਾਇਲTTS2, ਟੋਰਟੋਇਸ ਅਤੇ ਓਪਨਵਾਇਸ ਵਰਗਾ ਹੀ ਹੈ ।

ਦੋਵੇਂ ਹੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਟਾਇਲ ਅਤੇ ਭਾਵਨਾ ਕੰਟਰੋਲ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ । ਜ਼ੋਨੋਸ ਸੱਤ ਵੱਖ ਵੱਖ ਭਾਵਨਾ ਹਾਲਤਾਂ ਅਤੇ ਇੱਕ ਆਧੁਨਿਕ 1.6B ਆਰਕੀਟੈਕਚਰ ਦਿੰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਓਪਨਵਾਇਸ ਟੋਨ ਸਟਾਇਲ ਜਿਵੇਂ ਕਿ ਮਿੱਤਰਤਾਪੂਰਨ, ਖੁਸ਼ਹਾਲ ਅਤੇ ਬਹੁਤ ਤੇਜ਼ ਤੁਰੰਤ ਕਲੋਨਿੰਗ ਨਾਲ ਸੁਣਨਯੋਗ ਦਿੰਦਾ ਹੈ । ਜੇਕਰ ਤੁਸੀਂ ਸਪੱਸ਼ਟ ਭਾਵਨਾ ਚੋਣ ਅਤੇ ਵੱਧ ਤੋਂ ਵੱਧ ਭਾਵਨਾਤਮਕਤਾ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਜ਼ੋਨੋਸ ਚੁਣੋ; ਹਲਕੇ, ਤੇਜ਼ ਟੋਨ ਸ਼ਿਫਟਿੰਗ ਲਈ ਓਪਨਵਾਇਸ ਚੁਣੋ ।

ਬਾਰਕ [ਹੱਸੇ] ਅਤੇ [ਸਹਿਜ] ਵਰਗੇ ਭਾਵਨਾਤਮਕ ਮਾਰਕਰ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ, ਪਰ ਸੀਮਤ ਕਲੋਨਿੰਗ ਦਿੰਦਾ ਹੈ, ਅਤੇ ਡਾਈਆ ਗੈਰ- ਬੋਲੀ ਵਾਲੀਆਂ ਧੁਨੀਆਂ ਨਾਲ ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਉੱਤੇ ਕੇਂਦਰ ਕਰਦਾ ਹੈ । ਜ਼ੋਨੋਸ ਸਪੱਸ਼ਟ ਭਾਵਨਾਤਮਕ ਚੋਣ ਉੱਤੇ ਕੇਂਦਰ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਸਖਤ ਇੱਕਲੱਖ- ਧੁਨੀ ਕਲੋਨਿੰਗ ਹੈ, ਜੋ ਕਿ ਤੁਹਾਨੂੰ ਹਰ ਕਲਿੱਪ ਦੇ ਹਾਵ- ਭਾਵ ਉੱਤੇ ਸਹੀ ਕੰਟਰੋਲ ਦਿੰਦਾ ਹੈ । ਇੰਜਣ ਚੁਣੋ, ਜੋ ਕਿ ਤੁਹਾਨੂੰ ਈਮੋਸ਼ਨ ਟੈਗ, ਡਾਈਲਾਗ ਟਰਾਂਸ, ਜਾਂ ਚੁਣਨਯੋਗ ਈਮੋਸ਼ਨ ਦੀ ਲੋੜ ਹੈ ।

ਹਾਂ। ਨਵੇਂ TextToSpeechAI ਅਕਾਊਂਟ ਮੁਫਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ ਅਤੇ ਡੀਮੋ ਤੁਹਾਨੂੰ ਸੈਂਪਲ ਆਡੀਓ ਬਣਾਉਣ ਲਈ ਬਿਨਾਂ ਸਾਈਨ ਅੱਪ ਕੀਤੇ ਯੋਗ ਕਰਦਾ ਹੈ। ਇਹ ਹੋਰ ਕਰੈਡਿਟ ਖਰੀਦਣ ਤੋਂ ਪਹਿਲਾਂ ਜ਼ੋਨੋਸ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਟੈਸਟ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਹੈ।

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try ਖੇਤਰ Now

Generate your first audio free. No credit card required.

Start Free