ਦਿਨ

Ultra

ਡਾਈਲਾਗ- ਓਰੀਐਂਟਡ TTS, ਬੋਲੀ ਕਲੋਨਿੰਗ ਅਤੇ ਗੈਰ- ਬੋਲੀ ਸਾਊਂਡ ਨਾਲName

Medium ਗਤੀ

Excellent ਕੁਆਲਟੀ

ਹਾਂ ਕਲੋਨਿੰਗ

1 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ ਦਿਨ

ing the most accurate text-to-speech model for the most complex conversations. Dia is also capable of generating dialogues from 1000-1500 characters, and is capable of generating dialogues from 1000-1500 characters. Dia is also capable of generating dialogues from 1000-1500 characters, and is capable of generating dialogues from 1000-1500 characters, and is highly efficient

ਮੁੱਖ ਫੀਚਰ

ਡਾਈਲਾਗ ਨਿਰਮਾਣ

ਵੱਖਰੀਆਂ ਆਵਾਜ਼ਾਂ ਅਤੇ ਬਦਲਾਅ ਨਾਲ ਕੁਦਰਤੀ ਬਹੁ- ਸਪੀਕਰ ਗੱਲਬਾਤ ਬਣਾਓ।

ਗ਼ੈਰ- ਸ਼ਬਦ ਸਾਊਂਡ

ਕੁਦਰਤੀ ਪੈਰਾਲਿਂਗਵਿਸਟਿਕ ਭਾਵ ਲਈ [ਹੱਸੇ], [ਸਹਿਜ], [ਖੰਘ], (ਗੈਸਪ) ਸ਼ਾਮਲ ਕਰੋ ।

ਬੋਲੀ ਕਲੋਨਿੰਗ

ਨਿੱਜੀ ਬੋਲੀ ਲਈ 5-10 ਸਕਿੰਟ ਦੇ ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਕੋਈ ਵੀ ਆਵਾਜ਼ ਕਲੋਨ ਕਰੋ ।

ਕੁਦਰਤੀ ਗੱਲਬਾਤ

1.6B ਪੈਰਾਮੀਟਰ ਬਹੁਤ ਕੁਦਰਤੀ ਸੰਵਾਦੀ ਪਰੋਸੌਡੀ ਅਤੇ ਇੰਟੋਨੇਸ਼ਨ ਪੈਦਾ ਕਰਦੇ ਹਨ।

ਵਰਤੋਂ ਕੇਸ

ਡਾਈਲਾਗ ਅਤੇ ਗੱਲਬਾਤ ਪੈਦਾ ਕਰੋ ਕਈ ਅੱਖਰ ਨਾਲ ਆਡੀਓਬੁੱਕ ਉਤਪਾਦਨ ਖੇਡ ਅੱਖਰ ਆਵਾਜ਼ ਪੋਡਕਾਸਟ ਅਤੇ ਸਮੱਗਰੀ ਬਣਾਉਣਾ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ ਦਿਨ

1

ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

ਆਪਣੇ ਸਟਾਰਟਅੱਪ ਕ੍ਰੈਡਿਟ ਲਈ ਮੁਫਤ TextToSpeechAI ਅਕਾਊਂਟ ਬਣਾਓ, ਜਾਂ ਡਾਈਆ ਡਾਈਲਾਗ ਨੂੰ ਤੁਰੰਤ ਵਰਤਣ ਲਈ ਕੋਈ ਰਜਿਸਟਰ ਡੀਮੋ ਖੋਲ੍ਹੋ।
2

Dia ਇੰਜਣ ਚੁਣੋ

TTS ਡੈਸ਼ਬੋਰਡ ਵਿੱਚ ਇੰਜਣ ਲਿਸਟ ਵਿੱਚੋਂ Dia ਚੁਣੋ । Dia ਡਾਈਲਾਗ- ਓਰੀਐਂਟਡ, ਅਲਟਰਾ- ਟਾਇਰ ਮਾਡਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਬਹੁ- ਸਪੀਕਰ ਅਤੇ ਬੋਲੀ- ਕਲੋਨਿੰਗ ਸਹਿਯੋਗ ਹੈ ।
3

ਟੈਗ ਨਾਲ ਡਾਈਲਾਗ ਸਕ੍ਰਿਪਟ ਲਿਖੋ

ਹਰ ਸਪੀਕਰ ਦੀ ਵਾਰੀ ਨੂੰ ਨਿਸ਼ਾਨਬੱਧ ਕਰਨ ਲਈ [S1] ਅਤੇ [S2] ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੀ ਗੱਲਬਾਤ ਬਣਾਓ ਅਤੇ ਨਾ-ਵਰਚੁਅਲ ਟੈਗ ਜਿਵੇਂ ਕਿ [ਹੱਸਦਾ ਹੈ], [ਸਹਿਜ ਹੈ], [ਕਹਿਦਾ ਹੈ], ਜਾਂ (ਗੈਸਪ) ਜਿੱਥੇ ਤੁਸੀਂ ਕੁਦਰਤੀ ਪ੍ਰਤੀਕਰਮ ਚਾਹੁੰਦੇ ਹੋ।
4

ਆਡੀਓ ਬਣਾਓ

ਆਪਣੀ ਡਾਈਆ ਸਕ੍ਰਿਪਟ ਨੂੰ ਸਾਡੇ ਹੋਸਟ GPU ਨੂੰ ਭੇਜਣ ਲਈ ਬਣਾਓ ਕਲਿੱਕ ਕਰੋ । ਡਾਈਆ ਦੋ ਸਪੀਕਰ ਡਾਈਲਾਗ ਨੂੰ ਬਦਲਾ ਲੈਣ ਨਾਲ ਅਤੇ ਤੁਹਾਡੇ ਨਾ- ਬੋਲੀ ਟੈਗ ਨੂੰ ਇੱਕ ਆਡੀਓ ਫਾਇਲ ਵਿੱਚ ਪੇਸ਼ ਕਰਦਾ ਹੈ ।
5

API ਡਾਊਨਲੋਡ ਜਾਂ ਕਾਲ ਕਰੋ

ਖਤਮ ਡਾਈਲਾਗ ਨੂੰ ਆਪਣੀ ਚੁਣੀ ਫਾਰਮੈਟ ਵਿੱਚ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਪਣੇ ਅਕਾਊਂਟ ਟੋਕਨ ਨਾਲ TextToSpeechAI API ਵਿੱਚ ਇੱਕੋ [S1]/[S2] ਸਕ੍ਰਿਪਟ ਨੂੰ ਪੇਜ ਕਰਕੇ ਆਟੋਮੈਟਿਕ ਬਣਾਓ।

ਦਿਨ API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] ਹੈਲੋ! ਅੱਜ ਤੁਸੀਂ ਕਿਵੇਂ ਹੋ? [ਹੱਸਦਾ ਹੈ] [S2] ਮੈਂ ਬਹੁਤ ਵਧੀਆ ਕਰ ਰਿਹਾ ਹਾਂ, ਪੁੱਛਣ ਲਈ ਧੰਨਵਾਦ!",
    "voice": "en_US-lessac-medium"
  }'

API ਡੌਕੂਮੈਂਟ ਪੜ੍ਹੋ ਆਪਣੀ API ਕੁੰਜੀ ਲਵੋ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

Dia ਨਾਰੀ ਲੈਬਜ਼ ਦਾ 1.6B ਪੈਰਾਮੀਟਰ ਡਾਈਲਾਗ- ਓਰੀਐਂਟਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਮਾਡਲ ਹੈ । ਇਹ ਕਈ ਸਪੀਕਰ, ਗੈਰ- ਬੋਲੀਅਲ ਸੌਨਸ ਅਤੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ ਸਹਿਯੋਗ ਨਾਲ ਕੁਦਰਤੀ ਸੰਵਾਦੀ ਬੋਲੀ ਬਣਾਉਣ ਵਿੱਚ ਮਾਹਰ ਹੈ ।

ਹਾਂ, Dia ਪੂਰੀ ਤਰ੍ਹਾਂ Apache 2.0ਲਾਈਸੈਂਸਡ ਹੈ - ਕੋਡ ਅਤੇ ਮਾਡਲ ਭਾਰ ਦੋਵੇਂ ਹਨ । ਇਹ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਮੁਫ਼ਤ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ।

ਮੌਜੂਦਾ Dia ਸਿਰਫ ਅੰਗਰੇਜ਼ੀ ਲਈ ਹੀ ਸਹਾਇਕ ਹੈ । ਮਾਡਲ ਕੁਦਰਤੀ ਅੰਗਰੇਜ਼ੀ ਸੰਵਾਦ ਬੋਲੀ ਲਈ ਅਨੁਕੂਲ ਹੈ ।

ਡਾਈਆ ਨੂੰ ਆਪਣੇ 1.6B ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਲਈ ਲਗਭਗ 10GB VRAM ਦੀ ਲੋੜ ਹੈ। ਇੱਕ GPU, ਜਿਸ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ 12GB ਹੈ, ਨੂੰ ਆਰਾਮਦਾਇਕ ਓਪਰੇਸ਼ਨ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। TextToSpeechAI ਉੱਤੇ ਇਹ ਸਭ ਸਾਡੇ ਹੋਸਟ GPUs ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਤੁਹਾਨੂੰ ਆਪਣੇ ਆਪ ਨੂੰ ਕੋਈ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

ਹਾਂ - ਡਾਈਲਾਗ ਉਹੀ ਹੈ, ਜਿਸ ਲਈ ਡਾਈਆ ਬਣਾਇਆ ਗਿਆ ਹੈ । ਆਪਣੀ ਸਕ੍ਰਿਪਟ ਵਿੱਚ [S1] ਅਤੇ [S2] ਬਦਲ ਕੇ, ਡਾਈਆ TTS ਵੱਖਰੀਆਂ ਆਵਾਜ਼ਾਂ ਅਤੇ ਅਸਲੀ ਬਦਲਾਅ ਨਾਲ ਦੋ ਸਪੀਕਰ ਗੱਲਬਾਤ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਸਪੀਕਰ TTS ਮਾਡਲ ਨਾਲ ਪ੍ਰਾਪਤ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੈ ।

ਆਪਣੀ ਸਕ੍ਰਿਪਟ ਦੀ ਹਰੇਕ ਲਾਈਨ ਨੂੰ [S1] ਜਾਂ [S2] ਨਾਲ ਪਹਿਲਾਂ ਰੱਖੋ ਤਾਂ ਕਿ ਇਹ ਵੇਖਾਇਆ ਜਾ ਸਕੇ ਕਿ ਕੌਣ ਬੋਲ ਰਿਹਾ ਹੈ । Dia ਹਰ ਟੈਗ ਲਈ ਇੱਕ ਸਥਿਰ ਆਵਾਜ਼ ਦਿੰਦਾ ਹੈ ਅਤੇ ਗੱਲਬਾਤ ਦੇ ਚੱਲਣ ਨਾਲ ਉਨ੍ਹਾਂ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਇਸ ਲਈ [S1] ਅਤੇ [S2] ਤੁਹਾਡੇ ਡਾਈਲਾਗ ਵਿੱਚ ਦੋ ਅੱਖਰ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ ।

ਹਾਂ । Dia ਸਾਫ਼ ਰਿਫਰੈਂਸ ਆਡੀਓ ਦੇ ਲਗਭਗ 5-10 ਸਕਿੰਟ ਤੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਜੋ ਕਿ ਤੁਹਾਨੂੰ ਸਪੀਕਰ ਲਈ ਇੱਕ ਖਾਸ ਬੋਲੀ ਨੂੰ ਮੁੜ- ਵਰਤੋਂ ਕਰਨ ਦਿੰਦਾ ਹੈ । ਤੁਸੀਂ [S1]/[S2] ਟੈਗ ਨਾਲ ਕਲੋਨਿੰਗ ਨੂੰ ਜੋੜ ਸਕਦੇ ਹੋ ਤਾਂ ਕਿ ਡਾਈਲਾਗ ਵਿੱਚ ਹਰ ਅੱਖਰ ਤੁਹਾਡੀ ਕਲੋਨ ਕੀਤੀ ਬੋਲੀ ਵਾਂਗ ਸੁਣਾਈ ਦੇਵੇ ।

ਡਾਈਆ [ਹੱਸਦਾ ਹੈ], [ਸਹਿਜ ਹੁੰਦਾ ਹੈ], [ਖੰਘਦਾ ਹੈ], ਅਤੇ (ਗੈਸਪ) ਨੂੰ ਬੋਲੀ ਸ਼ਬਦਾਂ ਦੀ ਬਜਾਏ ਬੋਲੀ ਵਿੱਚ ਪਾਈ ਕੁਦਰਤੀ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਧੁਨ ਵਜੋਂ ਦਰਸਾਉਂਦਾ ਹੈ । ਟੈਗ ਨੂੰ ਜਿੱਥੇ ਤੁਸੀਂ ਪ੍ਰਤੀਕਰਮ ਚਾਹੁੰਦੇ ਹੋ, ਉਥੇ ਰੱਖੋ - ਉਦਾਹਰਨ ਲਈ "[S1] ਇਹ ਹੈਰਾਨੀਜਨਕ ਹੈ [ਹੱਸਦਾ ਹੈ]" - ਡਾਈਲਾਗ ਨੂੰ ਹੋਰ ਮਨੁੱਖੀ ਬਣਾਉਣ ਲਈ ।

Dia ਅਤੇ Bark ਦੋਵੇਂ ਹੀ ਗੈਰ-ਵਰਚੁਅਲ ਸਾਊਂਡ ਲਈ ਸਹਾਇਕ ਹਨ, ਪਰ Dia ਨੂੰ [S1]/[S2] ਟਰਾਂਸ-ਟੈੱਕਿੰਗ ਅਤੇ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਦੋ ਵਿਅਕਤੀਆਂ ਦੀ ਗੱਲਬਾਤ ਅਤੇ ਅੱਖਰ ਕੰਮ ਲਈ Dia ਚੁਣੋ; ਜਦੋਂ ਇੱਕ-ਆਵਾਜ਼ ਨਾਂਹ-ਵਾਚ ਵਿੱਚ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੋਵੇ ਤਾਂ Bark ਵਧੀਆ ਹੈ।

Dia ਇੱਕ ਅਲਟਰਾ-ਟਾਇਰ ਇੰਜਣ ਹੈ, ਇਸ ਲਈ ਇਸ ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 50 ਕ੍ਰੈਡਿਟ ਹੈ। ਅਲਟਰਾ-ਟਾਇਰ ਵੱਡਾ 1.6B ਮਾਡਲ ਅਤੇ ~10GB GPU ਮੈਮੋਰੀ ਹੈ, ਜੋ ਕਿ ਉੱਚ ਕੁਆਲਟੀ ਡਾਈਲਾਗ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।

ਹਾਂ। ਨਵੇਂ TextToSpeechAI ਅਕਾਊਂਟ ਮੁਫਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ, ਅਤੇ ਇੱਕ ਡੀਮੋ ਹੈ, ਜੋ ਕਿ ਤੁਸੀਂ ਬਿਨਾਂ ਸਾਈਨ ਅੱਪ ਕੀਤੇ ਚਲਾ ਸਕਦੇ ਹੋ। ਇਹ ਇੱਕ ਭੁਗਤਾਨ ਕੀਤੇ ਪਲਾਨ ਉੱਤੇ ਫੈਸਲਾ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ [S1]/[S2] ਟੈਗ ਨਾਲ ਇੱਕ ਛੋਟਾ Dia ਡਾਈਲਾਗ ਬਣਾਉਣ ਲਈ ਕਾਫ਼ੀ ਹੈ।

ਹਾਂ। ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਹਾਡੇ ਕੋਲ ਆਪਣੇ ਅਕਾਊਂਟ ਪੇਜ਼ ਤੋਂ API ਟੋਕਨ ਹੋਵੇ ਤਾਂ ਤੁਸੀਂ Dia ਡਾਈਲਾਗ ਸਕ੍ਰਿਪਟ - [S1]/[S2] ਟਰਾਂਸ ਅਤੇ ਟੈਗ ਜਿਵੇਂ ਕਿ [laughs] ਸਮੇਤ - TextToSpeechAI REST API ਨੂੰ ਭੇਜ ਸਕਦੇ ਹੋ ਅਤੇ ਆਡੀਓ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਡਾਊਨਲੋਡ ਕਰ ਸਕਦੇ ਹੋ।

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 1
GPU VRAM 10GB
Credits/1000 chars 50

Try ਦਿਨ Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

ਦਿਨ

ਬਾਰੇ ਦਿਨ

ਮੁੱਖ ਫੀਚਰ

ਡਾਈਲਾਗ ਨਿਰਮਾਣ

ਗ਼ੈਰ- ਸ਼ਬਦ ਸਾਊਂਡ

ਬੋਲੀ ਕਲੋਨਿੰਗ

ਕੁਦਰਤੀ ਗੱਲਬਾਤ

ਵਰਤੋਂ ਕੇਸ

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ ਦਿਨ

ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

Dia ਇੰਜਣ ਚੁਣੋ

ਟੈਗ ਨਾਲ ਡਾਈਲਾਗ ਸਕ੍ਰਿਪਟ ਲਿਖੋ

ਆਡੀਓ ਬਣਾਓ

API ਡਾਊਨਲੋਡ ਜਾਂ ਕਾਲ ਕਰੋ

ਦਿਨ API

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

Dia TTS ਕੀ ਹੈ?

ਕੀ Dia ਵਪਾਰਕ ਤੌਰ ਤੇ ਵਰਤਣ ਲਈ ਮੁਫ਼ਤ ਹੈ?

ਕਿਹੜੀਆਂ ਭਾਸ਼ਾਵਾਂ Dia ਸਹਿਯੋਗੀ ਹਨ?

ਕਿੰਨੀ GPU ਮੈਮੋਰੀ Dia ਨੂੰ ਲੋੜੀਦੀ ਹੈ?

ਕੀ Dia ਕਈ ਅੱਖਰ ਵਿੱਚ ਡਾਈਲਾਗ ਬਣਾ ਸਕਦਾ ਹੈ?

Dia ਸਪੀਕਰ ਟੈਗ [S1] ਅਤੇ [S2] ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ?

ਕੀ Dia ਆਵਾਜ਼ਾਂ ਕਲੋਨ ਕਰਦਾ ਹੈ?

ਡਾਈਆ ਵਿੱਚ [ਹੱਸੇ] ਅਤੇ [ਸਹਿਜ] ਵਰਗੇ ਨਾ-ਵਰਚੁਅਲ ਟੈਗ ਕਿਵੇਂ ਸੁਣਨ ਨੂੰ ਮਿਲਦੇ ਹਨ?

ਡਾਈਆ ਬਨਾਮ ਬਾਰਕ: ਕਿਹੜਾ ਵਰਤਣਾ ਹੈ?

TextToSpeechAI ਉੱਤੇ Dia ਦੀ ਕੀਮਤ ਕਿੰਨੇ ਕਰੈਡਿਟ ਹੈ?

ਕੀ ਮੈਂ Dia TTS ਮੁਫਤ ਲਈ ਵਰਤ ਸਕਦਾ ਹਾਂ?

ਕੀ ਮੈਂ TextToSpeechAI API ਰਾਹੀਂ Dia ਵਰਤ ਸਕਦਾ ਹਾਂ?

Technical Specs

Try ਦਿਨ Now

Other TTS Engines

ਬਾਰ

ਚੈਟਰਬਾਕਸ

ਕੋਸੀ- ਆਵਾਜ਼2Name