ਦਿਨ

Ultra

ਡਾਈਲਾਗ- ਓਰੀਐਂਟਡ TTS, ਬੋਲੀ ਕਲੋਨਿੰਗ ਅਤੇ ਗੈਰ- ਬੋਲੀ ਸਾਊਂਡ ਨਾਲName

Medium ਗਤੀ
Excellent ਕੁਆਲਟੀ
ਹਾਂ ਕਲੋਨਿੰਗ
1 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ ਦਿਨ

ing the most accurate text-to-speech model for the most complex conversations. Dia is also capable of generating dialogues from 1000-1500 characters, and is capable of generating dialogues from 1000-1500 characters. Dia is also capable of generating dialogues from 1000-1500 characters, and is capable of generating dialogues from 1000-1500 characters, and is highly efficient

ਮੁੱਖ ਫੀਚਰ

ਡਾਈਲਾਗ ਨਿਰਮਾਣ

ਵੱਖਰੀਆਂ ਆਵਾਜ਼ਾਂ ਅਤੇ ਬਦਲਾਅ ਨਾਲ ਕੁਦਰਤੀ ਬਹੁ- ਸਪੀਕਰ ਗੱਲਬਾਤ ਬਣਾਓ।

ਗ਼ੈਰ- ਸ਼ਬਦ ਸਾਊਂਡ

ਕੁਦਰਤੀ ਪੈਰਾਲਿਂਗਵਿਸਟਿਕ ਭਾਵ ਲਈ [ਹੱਸੇ], [ਸਹਿਜ], [ਖੰਘ], (ਗੈਸਪ) ਸ਼ਾਮਲ ਕਰੋ ।

ਬੋਲੀ ਕਲੋਨਿੰਗ

ਨਿੱਜੀ ਬੋਲੀ ਲਈ 5-10 ਸਕਿੰਟ ਦੇ ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਕੋਈ ਵੀ ਆਵਾਜ਼ ਕਲੋਨ ਕਰੋ ।

ਕੁਦਰਤੀ ਗੱਲਬਾਤ

1.6B ਪੈਰਾਮੀਟਰ ਬਹੁਤ ਕੁਦਰਤੀ ਸੰਵਾਦੀ ਪਰੋਸੌਡੀ ਅਤੇ ਇੰਟੋਨੇਸ਼ਨ ਪੈਦਾ ਕਰਦੇ ਹਨ।

ਵਰਤੋਂ ਕੇਸ

ਡਾਈਲਾਗ ਅਤੇ ਗੱਲਬਾਤ ਪੈਦਾ ਕਰੋ ਕਈ ਅੱਖਰ ਨਾਲ ਆਡੀਓਬੁੱਕ ਉਤਪਾਦਨ ਖੇਡ ਅੱਖਰ ਆਵਾਜ਼ ਪੋਡਕਾਸਟ ਅਤੇ ਸਮੱਗਰੀ ਬਣਾਉਣਾ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ ਦਿਨ

  1. 1

    ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

    ਆਪਣੇ ਸਟਾਰਟਅੱਪ ਕ੍ਰੈਡਿਟ ਲਈ ਮੁਫਤ TextToSpeechAI ਅਕਾਊਂਟ ਬਣਾਓ, ਜਾਂ ਡਾਈਆ ਡਾਈਲਾਗ ਨੂੰ ਤੁਰੰਤ ਵਰਤਣ ਲਈ ਕੋਈ ਰਜਿਸਟਰ ਡੀਮੋ ਖੋਲ੍ਹੋ।

  2. 2

    Dia ਇੰਜਣ ਚੁਣੋ

    TTS ਡੈਸ਼ਬੋਰਡ ਵਿੱਚ ਇੰਜਣ ਲਿਸਟ ਵਿੱਚੋਂ Dia ਚੁਣੋ । Dia ਡਾਈਲਾਗ- ਓਰੀਐਂਟਡ, ਅਲਟਰਾ- ਟਾਇਰ ਮਾਡਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਬਹੁ- ਸਪੀਕਰ ਅਤੇ ਬੋਲੀ- ਕਲੋਨਿੰਗ ਸਹਿਯੋਗ ਹੈ ।

  3. 3

    ਟੈਗ ਨਾਲ ਡਾਈਲਾਗ ਸਕ੍ਰਿਪਟ ਲਿਖੋ

    ਹਰ ਸਪੀਕਰ ਦੀ ਵਾਰੀ ਨੂੰ ਨਿਸ਼ਾਨਬੱਧ ਕਰਨ ਲਈ [S1] ਅਤੇ [S2] ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੀ ਗੱਲਬਾਤ ਬਣਾਓ ਅਤੇ ਨਾ-ਵਰਚੁਅਲ ਟੈਗ ਜਿਵੇਂ ਕਿ [ਹੱਸਦਾ ਹੈ], [ਸਹਿਜ ਹੈ], [ਕਹਿਦਾ ਹੈ], ਜਾਂ (ਗੈਸਪ) ਜਿੱਥੇ ਤੁਸੀਂ ਕੁਦਰਤੀ ਪ੍ਰਤੀਕਰਮ ਚਾਹੁੰਦੇ ਹੋ।

  4. 4

    ਆਡੀਓ ਬਣਾਓ

    ਆਪਣੀ ਡਾਈਆ ਸਕ੍ਰਿਪਟ ਨੂੰ ਸਾਡੇ ਹੋਸਟ GPU ਨੂੰ ਭੇਜਣ ਲਈ ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ । ਡਾਈਆ ਦੋ ਸਪੀਕਰ ਡਾਈਲਾਗ ਨੂੰ ਬਦਲਾ ਲੈਣ ਨਾਲ ਅਤੇ ਤੁਹਾਡੇ ਨਾ- ਬੋਲੀ ਟੈਗ ਨੂੰ ਇੱਕ ਆਡੀਓ ਫਾਇਲ ਵਿੱਚ ਪੇਸ਼ ਕਰਦਾ ਹੈ ।

  5. 5

    API ਡਾਊਨਲੋਡ ਜਾਂ ਕਾਲ ਕਰੋ

    ਖਤਮ ਡਾਈਲਾਗ ਨੂੰ ਆਪਣੀ ਚੁਣੀ ਫਾਰਮੈਟ ਵਿੱਚ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਪਣੇ ਅਕਾਊਂਟ ਟੋਕਨ ਨਾਲ TextToSpeechAI API ਵਿੱਚ ਇੱਕੋ [S1]/[S2] ਸਕ੍ਰਿਪਟ ਨੂੰ ਪੇਜ ਕਰਕੇ ਆਟੋਮੈਟਿਕ ਬਣਾਓ।

ਦਿਨ API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] ਹੈਲੋ! ਅੱਜ ਤੁਸੀਂ ਕਿਵੇਂ ਹੋ? [ਹੱਸਦਾ ਹੈ] [S2] ਮੈਂ ਬਹੁਤ ਵਧੀਆ ਕਰ ਰਿਹਾ ਹਾਂ, ਪੁੱਛਣ ਲਈ ਧੰਨਵਾਦ!",
    "voice": "en_US-lessac-medium"
  }'

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

Dia ਨਾਰੀ ਲੈਬਜ਼ ਦਾ 1.6B ਪੈਰਾਮੀਟਰ ਡਾਈਲਾਗ- ਓਰੀਐਂਟਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਮਾਡਲ ਹੈ । ਇਹ ਕਈ ਸਪੀਕਰ, ਗੈਰ- ਬੋਲੀਅਲ ਸੌਨਸ ਅਤੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ ਸਹਿਯੋਗ ਨਾਲ ਕੁਦਰਤੀ ਸੰਵਾਦੀ ਬੋਲੀ ਬਣਾਉਣ ਵਿੱਚ ਮਾਹਰ ਹੈ ।

ਹਾਂ, Dia ਪੂਰੀ ਤਰ੍ਹਾਂ Apache 2.0ਲਾਈਸੈਂਸਡ ਹੈ - ਕੋਡ ਅਤੇ ਮਾਡਲ ਭਾਰ ਦੋਵੇਂ ਹਨ । ਇਹ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਮੁਫ਼ਤ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ।

ਮੌਜੂਦਾ Dia ਸਿਰਫ ਅੰਗਰੇਜ਼ੀ ਲਈ ਹੀ ਸਹਾਇਕ ਹੈ । ਮਾਡਲ ਕੁਦਰਤੀ ਅੰਗਰੇਜ਼ੀ ਸੰਵਾਦ ਬੋਲੀ ਲਈ ਅਨੁਕੂਲ ਹੈ ।

ਡਾਈਆ ਨੂੰ ਆਪਣੇ 1.6B ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਲਈ ਲਗਭਗ 10GB VRAM ਦੀ ਲੋੜ ਹੈ। ਇੱਕ GPU, ਜਿਸ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ 12GB ਹੈ, ਨੂੰ ਆਰਾਮਦਾਇਕ ਓਪਰੇਸ਼ਨ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। TextToSpeechAI ਉੱਤੇ ਇਹ ਸਭ ਸਾਡੇ ਹੋਸਟ GPUs ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਆਪ ਨੂੰ ਕੋਈ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

ਹਾਂ - ਡਾਈਲਾਗ ਉਹੀ ਹੈ, ਜਿਸ ਲਈ ਡਾਈਆ ਬਣਾਇਆ ਗਿਆ ਹੈ । ਆਪਣੀ ਸਕ੍ਰਿਪਟ ਵਿੱਚ [S1] ਅਤੇ [S2] ਬਦਲ ਕੇ, ਡਾਈਆ TTS ਵੱਖਰੀਆਂ ਆਵਾਜ਼ਾਂ ਅਤੇ ਅਸਲੀ ਬਦਲਾਅ ਨਾਲ ਦੋ ਸਪੀਕਰ ਗੱਲਬਾਤ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਸਪੀਕਰ TTS ਮਾਡਲ ਨਾਲ ਪ੍ਰਾਪਤ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੈ ।

ਆਪਣੀ ਸਕ੍ਰਿਪਟ ਦੀ ਹਰੇਕ ਲਾਈਨ ਨੂੰ [S1] ਜਾਂ [S2] ਨਾਲ ਪਹਿਲਾਂ ਰੱਖੋ ਤਾਂ ਕਿ ਇਹ ਵੇਖਾਇਆ ਜਾ ਸਕੇ ਕਿ ਕੌਣ ਬੋਲ ਰਿਹਾ ਹੈ । Dia ਹਰ ਟੈਗ ਲਈ ਇੱਕ ਸਥਿਰ ਆਵਾਜ਼ ਦਿੰਦਾ ਹੈ ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਚੱਲਣ ਨਾਲ ਉਨ੍ਹਾਂ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਇਸ ਲਈ [S1] ਅਤੇ [S2] ਤੁਹਾਡੇ ਡਾਈਲਾਗ ਵਿੱਚ ਦੋ ਅੱਖਰ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ ।

ਹਾਂ । Dia ਸਾਫ਼ ਰਿਫਰੈਂਸ ਆਡੀਓ ਦੇ ਲਗਭਗ 5-10 ਸਕਿੰਟ ਤੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਜੋ ਕਿ ਤੁਹਾਨੂੰ ਸਪੀਕਰ ਲਈ ਇੱਕ ਖਾਸ ਬੋਲੀ ਨੂੰ ਮੁੜ- ਵਰਤੋਂ ਕਰਨ ਦਿੰਦਾ ਹੈ । ਤੁਸੀਂ [S1]/[S2] ਟੈਗ ਨਾਲ ਕਲੋਨਿੰਗ ਨੂੰ ਜੋੜ ਸਕਦੇ ਹੋ ਤਾਂ ਕਿ ਡਾਈਲਾਗ ਵਿੱਚ ਹਰ ਅੱਖਰ ਤੁਹਾਡੀ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਵਾਂਗ ਸੁਣਾਈ ਦੇਵੇ ।

ਡਾਈਆ [ਹੱਸਦਾ ਹੈ], [ਸਹਿਜ ਹੁੰਦਾ ਹੈ], [ਖੰਘਦਾ ਹੈ], ਅਤੇ (ਗੈਸਪ) ਨੂੰ ਬੋਲੀ ਸ਼ਬਦਾਂ ਦੀ ਬਜਾਏ ਬੋਲੀ ਵਿੱਚ ਪਾਈ ਕੁਦਰਤੀ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਧੁਨ ਵਜੋਂ ਦਰਸਾਉਂਦਾ ਹੈ । ਟੈਗ ਨੂੰ ਜਿੱਥੇ ਤੁਸੀਂ ਪ੍ਰਤੀਕਰਮ ਚਾਹੁੰਦੇ ਹੋ, ਉਥੇ ਰੱਖੋ - ਉਦਾਹਰਨ ਲਈ "[S1] ਇਹ ਹੈਰਾਨੀਜਨਕ ਹੈ [ਹੱਸਦਾ ਹੈ]" - ਡਾਈਲਾਗ ਨੂੰ ਹੋਰ ਮਨੁੱਖੀ ਬਣਾਉਣ ਲਈ ।

Dia ਅਤੇ Bark ਦੋਵੇਂ ਹੀ ਗੈਰ-ਵਰਚੁਅਲ ਸਾਊਂਡ ਲਈ ਸਹਾਇਕ ਹਨ, ਪਰ Dia ਨੂੰ [S1]/[S2] ਟਰਾਂਸ-ਟੈੱਕਿੰਗ ਅਤੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਦੋ ਵਿਅਕਤੀਆਂ ਦੀ ਗੱਲਬਾਤ ਅਤੇ ਅੱਖਰ ਕੰਮ ਲਈ Dia ਚੁਣੋ; ਜਦੋਂ ਇੱਕ-ਆਵਾਜ਼ ਨਾਂਹ-ਵਾਚ ਵਿੱਚ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੋਵੇ ਤਾਂ Bark ਵਧੀਆ ਹੈ।

Dia ਇੱਕ ਅਲਟਰਾ-ਟਾਇਰ ਇੰਜਣ ਹੈ, ਇਸ ਲਈ ਇਸ ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 50 ਕ੍ਰੈਡਿਟ ਹੈ। ਅਲਟਰਾ-ਟਾਇਰ ਵੱਡਾ 1.6B ਮਾਡਲ ਅਤੇ ~10GB GPU ਮੈਮੋਰੀ ਹੈ, ਜੋ ਕਿ ਉੱਚ ਕੁਆਲਟੀ ਡਾਈਲਾਗ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।

ਹਾਂ। ਨਵੇਂ TextToSpeechAI ਅਕਾਊਂਟ ਮੁਫਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ, ਅਤੇ ਇੱਕ ਡੀਮੋ ਹੈ, ਜੋ ਕਿ ਤੁਸੀਂ ਬਿਨਾਂ ਸਾਈਨ ਅੱਪ ਕੀਤੇ ਚਲਾ ਸਕਦੇ ਹੋ। ਇਹ ਇੱਕ ਭੁਗਤਾਨ ਕੀਤੇ ਪਲਾਨ ਉੱਤੇ ਫੈਸਲਾ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ [S1]/[S2] ਟੈਗ ਨਾਲ ਇੱਕ ਛੋਟਾ Dia ਡਾਈਲਾਗ ਬਣਾਉਣ ਲਈ ਕਾਫ਼ੀ ਹੈ।

ਹਾਂ। ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਹਾਡੇ ਕੋਲ ਆਪਣੇ ਅਕਾਊਂਟ ਪੇਜ਼ ਤੋਂ API ਟੋਕਨ ਹੋਵੇ ਤਾਂ ਤੁਸੀਂ Dia ਡਾਈਲਾਗ ਸਕ੍ਰਿਪਟ - [S1]/[S2] ਟਰਾਂਸ ਅਤੇ ਟੈਗ ਜਿਵੇਂ ਕਿ [laughs] ਸਮੇਤ - TextToSpeechAI REST API ਨੂੰ ਭੇਜ ਸਕਦੇ ਹੋ ਅਤੇ ਆਡੀਓ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਡਾਊਨਲੋਡ ਕਰ ਸਕਦੇ ਹੋ।

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try ਦਿਨ Now

Generate your first audio free. No credit card required.

Start Free