F5- TTS

Premium

ਕਲੋਨਿੰਗ ਨਾਲ ਤੇਜ਼, ਸੁਖਾਲਾ ਅਤੇ ਭਰੋਸੇਯੋਗ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚName

Fast ਗਤੀ
Very Good ਕੁਆਲਟੀ
ਹਾਂ ਕਲੋਨਿੰਗ
5 ਭਾਸ਼ਾਵਾਂ

ਬਾਰੇ F5- TTS

ability. It is based on the F5-TTS model, which is the most widely used text-to-speech model in the world. F5-TTS is the first text-to-speech model to be developed for the

ਮੁੱਖ ਫੀਚਰ

ਤੇਜ਼ ਨਿਰਮਾਣ

ਤੇਜ਼ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਲਈ ਗ਼ੈਰ- ਆਟੋਰਿਗਰੇਸਿਵ ਆਰਕੀਟੈਕਚਰ ਹੈ । Name

ਜ਼ੀਰੋ- ਸ਼ੋਟ ਕਲੋਨਿੰਗ

ਬਿਨਾਂ ਫਿਨ-ਟੂਨਿੰਗ ਦੇ ਛੋਟੇ ਆਡੀਓ ਸੈਮਪਲ ਤੋਂ ਕੋਈ ਵੀ ਆਵਾਜ਼ ਕਲੋਨ ਕਰੋ ।

ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ

ਫਲੋ ਮੇਲਿੰਗ ਕੁਦਰਤੀ, ਉੱਚ ਕੁਆਲਟੀ ਬੋਲੀ ਆਉਟਪੁੱਟ ਦਿੰਦੀ ਹੈ ।

ਕੁਦਰਤੀ ਤਰੱਕੀ

ਸਮੁੱਚੇ ਰੂਪ ਵਿੱਚ ਸੁੰਦਰ ਪਰੋਸੋਡੀ ਅਤੇ ਕੁਦਰਤੀ ਰੀਥਮ।

ਬਹੁ- ਭਾਸ਼ਾ

ਕੁਦਰਤੀ ਉਚਾਰਨ ਨਾਲ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਖੋਲ੍ਹੋ ਸਰੋਤ

MIT ਲਾਈਸੈਂਸ ਪੂਰੀ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਹੈ ।

ਵਰਤੋਂ ਕੇਸ

ਸਮੱਗਰੀ ਬਣਾਉਣਾ ਵਿਡੀਓ ਡੁਪਲੀਕੇਟ ਆਡੀਓਬੁੱਕ ਨਿਰਮਾਣ ਪੋਡਕਾਸਟ ਬਣਾਉਣਾ ਪਸੰਦੀਦਾ ਸਹਾਇਕ ਰੀਅਲ- ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨName

ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ F5- TTS

  1. 1

    ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ

    ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮੁਫਤ TextToSpeechAI ਖਾਤਾ ਬਣਾਓ, ਜਾਂ ਮੁਫਤ ਡੀਮੋ ਵਿੱਚ ਸਿੱਧਾ ਜਾਓ F5-TTS ਨੂੰ ਕੋਈ ਭੁਗਤਾਨ ਲੋੜੀਦਾ ਨਾ ਹੋਣ ਨਾਲ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ।

  2. 2

    F5- TTS ਚੁਣੋ ਅਤੇ (ਚੋਣਵਾਂ) ਇੱਕ ਹਵਾਲਾ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ

    ਆਪਣੇ ਇੰਜਣ ਵਜੋਂ F5- TTS ਚੁਣੋ । ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ, ਟਿਕਾਣੇ ਸਪੀਕਰ ਦਾ ਇੱਕ ਛੋਟਾ 10- 30 ਸਕਿੰਟ ਰਿਫਰੈਸ਼ਨ ਸੈਪਲ ਅੱਪਲੋਡ ਕਰੋ ਤਾਂ ਕਿ F5- TTS ਉਨ੍ਹਾਂ ਦਾ ਟੋਨ ਅਤੇ ਐਕਸਟੈਂਸ਼ਨ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਲੈ ਸਕੇ । ਇੱਕ ਅੰਦਰੂਨੀ F5- TTS ਆਵਾਜ਼ ਵਰਤਣ ਲਈ ਇਹ ਕਦਮ ਛੱਡੋ ।

  3. 3

    ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ

    ਟੈਕਸਟ, ਜੋ ਕਿ ਤੁਸੀਂ ਬੋਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਟਾਈਪ ਕਰੋ ਜਾਂ ਚੇਪੋ । F5- TTS ਇਸ ਨੂੰ ਤੁਹਾਡੀ ਚੁਣੀ ਜਾਂ ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਸੁਣਾਉਂਦਾ ਹੈ, ਕਈ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਸਧਾਰਨ ਪਰੋਸੌਡੀ ਨਾਲ ।

  4. 4

    ਬੋਲੀ ਬਣਾਓ

    F5-TTS ਸਾਡੇ GPU ਇੰਫਰਾਸਟਰਕਚਰ ਉੱਤੇ ਤੇਜ਼ੀ ਨਾਲ ਆਡੀਓ ਸੰਸਲੇਸ਼ਣ ਕਰਦਾ ਹੈ, ਪ੍ਰੀਮੀਅਮ ਰੇਟ 25 ਕ੍ਰੈਡਿਟ ਪ੍ਰਤੀ 1000 ਅੱਖਰ ਹੈ।

  5. 5

    API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ

    MP3, WAV ਜਾਂ OGG ਦੇ ਰੂਪ ਵਿੱਚ ਆਡੀਓ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਆਟੋਮੈਟਿਕ ਬਣਾਉਣ ਲਈ F5-TTS ਵੌਇਸ ID ਨਾਲ TextToSpeechAI API ਕਾਲ ਕਰੋ।

F5- TTS API

TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "F5\u002D TTS ਤੇਜ਼, ਬੋਲਣਯੋਗ ਭਾਸ਼ਾ ਨਾਲ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਸਮਰੱਥਾ ਦਿੰਦਾ ਹੈ ।",
    "voice": "en_US-lessac-medium"
  }'

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

F5- TTS (Fast, Fluent, Faithful TTS) ਇੱਕ ਆਧੁਨਿਕ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਕੁਸ਼ਲ, ਉੱਚ ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਲਈ ਫਲੋ ਮੇਲਿੰਗ ਵਰਤਦਾ ਹੈ । ਇਹ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ ਅਤੇ ਰਵਾਇਤੀ ਆਟੋ- ਰਿਗਰੈਸ਼ਨ ਮਾਡਲਾਂ ਨਾਲੋਂ ਤੇਜ਼ ਕੁਦਰਤੀ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ । TextToSpeechAI ਉੱਤੇ, F5- TTS ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਵਰਤਿਆ ਡਿਫਾਲਟ ਇੰਜਣ ਹੈ ।

F5- TTS ਇੱਕ ਬੋਲੀ ਨੂੰ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਕਲੋਨ ਕਰਦਾ ਹੈ, ਕੋਈ ਟਰੇਨਿੰਗ ਲੋੜੀਦੀ ਨਹੀਂ ਹੈ: ਤੁਸੀਂ ਟਿਕਾਣੇ ਸਪੀਕਰ ਦਾ ਇੱਕ ਛੋਟਾ ਹਵਾਲਾ ਰਿਕਾਰਡ ਅੱਪਲੋਡ ਕਰਦੇ ਹੋ, ਅਤੇ ਮਾਡਲ ਉਸ ਦੇ ਬੋਲੀ ਗੁਣਾਂ ਨੂੰ ਤੁਰੰਤ ਕੱਢ ਲੈਂਦਾ ਹੈ । ਫਿਰ ਇਹ ਕਲੋਨ ਬੋਲੀ ਵਿੱਚ ਕੋਈ ਵੀ ਪਾਠ ਸੰਸਲੇਸ਼ਿਤ ਕਰਦਾ ਹੈ, ਟੋਨ, ਅੱਖਰਾਂ ਅਤੇ ਸੈਂਪਲ ਤੋਂ ਪਰੋਸੌਡੀ ਨੂੰ ਫੜਦਾ ਹੈ ।

F5- TTS ਇੱਕ ਛੋਟੇ ਹਵਾਲਾ ਕਲਿੱਪ ਤੋਂ ਇੱਕ ਆਵਾਜ਼ ਨੂੰ ਕਲੋਨ ਕਰ ਸਕਦਾ ਹੈ, ਜੋ ਕਿ 10 ਤੋਂ 30 ਸਕਿੰਟ ਦੀ ਸਾਫ਼ ਬੋਲੀ ਹੈ । ਇੱਕ ਸਪਸ਼ਟ, ਨੋਜ਼- ਫਰੀ ਰਿਕਾਰਡਿੰਗ ਸਭ ਤੋਂ ਭਰੋਸੇਯੋਗ ਨਤੀਜੇ ਦਿੰਦੀ ਹੈ, ਅਤੇ ਤੁਹਾਨੂੰ ਪੁਰਾਣੇ ਕਲੋਨਿੰਗ ਸਿਸਟਮਾਂ ਵਾਂਗ ਟਰੇਨਿੰਗ ਡਾਟਾ ਦੇ ਘੰਟਿਆਂ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ ।

ਹਾਂ । F5- TTS ਕੋਡ MIT ਲਾਈਸੈਂਸ ਹੈ, ਅਤੇ TextToSpeechAI OpenF5- TTS- Base ਭਾਰ ਚਲਾਉਦਾ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਤੌਰ ਉੱਤੇ ਮਨਜ਼ੂਰ ਅਪਾਚੀ 2.0ਲਾਈਸੈਂਸ ਦੇ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ । ਇਹ ਸੰਯੋਗ F5- TTS ਨੂੰ ਵਪਾਰਕ ਉਤਪਾਦਾਂ ਵਿੱਚ ਵਰਤਣ ਲਈ ਸੁਰੱਖਿਅਤ ਬਣਾਉਂਦਾ ਹੈ, ਜੇਕਰ ਤੁਸੀਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਲਈ ਅਧਿਕਾਰ ਰੱਖਦੇ ਹੋ, ਜੋ ਕਿ ਤੁਸੀਂ ਕਲੋਨ ਕਰਦੇ ਹੋ ।

ਹਾਂ । F5- TTS ਇੱਕ ਗ਼ੈਰ- ਆਟੋਰਿਗਰੇਸਿਵ ਫਲੋ- ਮੇਲਿੰਗ ਆਰਕੀਟੈਕਚਰ ਵਰਤਦਾ ਹੈ, ਇਸ ਲਈ ਇਹ ਆਟੋਰਿਗਰੇਸਿਵ ਮਾਡਲਾਂ ਜਿਵੇਂ ਕਿ ਬਾਰਕ ਜਾਂ ਟੋਰਟੋਇਸ ਨਾਲੋਂ ਤੇਜ਼ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਇਸ ਨੂੰ ਰੀਅਲ- ਟਾਈਮ ਅਤੇ ਉੱਚ- ਵੋਲਟੇਜ ਵਰਕਲੋਡ ਲਈ ਢੁੱਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਹੈ ।

F5- TTS ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ, ਸਲੀਕੇ ਨਾਲ ਰਿਦਮ ਅਤੇ ਸਪੱਸ਼ਟ ਸੰਚਾਰ ਨਾਲ ਉੱਚ ਕੁਆਲਟੀ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਕੁਆਲਟੀ ਅਤੇ ਸਪੀਡ ਦਾ ਇੱਕ ਵਧੀਆ ਸੰਤੁਲਨ ਹੈ, ਜੋ ਕਿ ਇਸ ਨੂੰ ਬਹੁਤੇ ਸਮੱਗਰੀ, ਨਾਂਅ- ਪਛਾਣ ਅਤੇ ਕਲੋਨਿੰਗ ਵਰਤੋਂ ਲਈ ਇੱਕ ਮਜ਼ਬੂਤ ਡਿਫਾਲਟ ਬਣਾਉਂਦਾ ਹੈ ।

F5- TTS VRAM ਉੱਤੇ ਤੇਜ਼ ਅਤੇ ਹਲਕਾ ਹੈ, ਇਸ ਨੂੰ ਤੁਰੰਤ ਜਾਂ ਵੱਡੀਆਂ ਬੈਚਾਂ ਦੀ ਲੋੜ ਹੋਣ ਉੱਤੇ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ, ਅਤੇ ਇਹ TextToSpeechAI ਦਾ ਡਿਫਾਲਟ ਕਲੋਨਿੰਗ ਇੰਜਣ ਹੈ। StyleTTS2 ਇੱਕ ਅਲਟਰਾ- ਟਾਇਰ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ Raw Fidelity ਉੱਤੇ F5- TTS ਨੂੰ ਪਾਰ ਕਰ ਸਕਦਾ ਹੈ, ਇਸ ਲਈ StyleTTS2 ਚੁਣੋ, ਜਦੋਂ ਵੱਧੋ- ਵੱਧ ਕੁਆਲਟੀ ਤੇ ਸਪੀਡ ਅਤੇ ਕੀਮਤ ਤੋਂ ਵੱਧ ਧਿਆਨ ਦਿੱਤਾ ਜਾਵੇ।

F5- TTS ਅੰਗਰੇਜ਼ੀ, ਚੀਨੀ ਅਤੇ ਹੋਰ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਕੁਦਰਤੀ ਉਚਾਰਨ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਪਾਰ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਵੀ ਹੈਂਡਲ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਤੁਹਾਨੂੰ ਇੱਕ ਕਲੋਨ ਵੌਇਸ ਨੂੰ ਅਸਲੀ ਹਵਾਲਾ ਰਿਕਾਰਡਿੰਗ ਤੋਂ ਵੱਖਰੀ ਭਾਸ਼ਾ ਬੋਲਣ ਲਈ ਵਰਤਣ ਦਿੰਦਾ ਹੈ ।

F5-TTS ਮੈਮੋਰੀ-ਸਹੂਲਤ ਵਾਲਾ ਹੈ, ਆਮ ਤੌਰ ਉੱਤੇ VRAM ਦੀ 4-6GB ਲੋੜੀਦੀ ਹੈ। TextToSpeechAI ਉੱਤੇ ਸਭ ਪੀੜ੍ਹੀਆਂ ਸਾਡੇ GPU ਇੰਫਰਾਸਟਰਕਚਰ ਉੱਤੇ ਚੱਲਦੀਆਂ ਹਨ, ਇਸ ਲਈ ਇਸ ਨੂੰ ਵਰਤਣ ਲਈ ਤੁਹਾਨੂੰ ਲੋਕਲ GPU ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

F5-TTS ਇੱਕ ਪ੍ਰੀਮੀਅਮ-ਟਾਇਰ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ TextToSpeechAI ਉੱਤੇ ਹੈ, ਅਤੇ ਪ੍ਰਤੀ 1000 ਅੱਖਰ 25 ਕਰੈਡਿਟ ਦੀ ਬਿੱਲ ਹੈ। ਨਵੇਂ ਅਕਾਊਂਟ ਮੁਫ਼ਤ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ, ਤਾਂ ਕਿ ਤੁਸੀਂ ਹੋਰ ਖਰੀਦਣ ਤੋਂ ਪਹਿਲਾਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਸਮੇਤ F5-TTS ਟੈਸਟ ਕਰ ਸਕਦੇ ਹੋ।

ਹਾਂ, ਤੁਸੀਂ TextToSpeechAI ਉੱਤੇ ਮੁਫਤ ਡੈਮੋ ਰਾਹੀਂ F5-TTS ਦੀ ਵਰਤੋਂ ਬਿਨਾਂ ਕਿਸੇ ਭੁਗਤਾਨ ਦੇ ਕਰ ਸਕਦੇ ਹੋ, ਅਤੇ ਮੁਫਤ ਅਕਾਊਂਟ ਬਣਾਉਣ ਨਾਲ ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਮਿਲਦਾ ਹੈ ਤਾਂ ਕਿ ਤੁਸੀਂ ਬੋਲੀ ਬਣਾ ਅਤੇ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰ ਸਕੋ । ਸਿਰਫ ਤਾਂ ਹੀ ਅੱਪਗਰੇਡ ਕਰੋ ਜਦੋਂ ਤੁਹਾਨੂੰ ਹੋਰ ਅੱਖਰ ਚਾਹੀਦੇ ਹੋਣ ।

ਸਾਡੀ ਲਾਇਬਰੇਰੀ ਵਿੱਚੋਂ ਮੌਜੂਦਾ F5- TTS ਆਵਾਜ਼ ਚੁਣੋ, ਜਾਂ ਰਿਫਰੈਸ਼ਨ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰਕੇ ਕਲੋਨ ਆਵਾਜ਼ ਬਣਾਓ, ਫਿਰ ਆਪਣੀ API ਮੰਗ ਵਿੱਚ ਆਵਾਜ਼ ID ਭੇਜੋ। F5- TTS ਨਿੱਜੀ WAV ਆਉਟਪੁੱਟ ਦਿੰਦਾ ਹੈ, ਅਤੇ TextToSpeechAI ਆਟੋਮੈਟਿਕ ਬਦਲਾਅ ਨਾਲ MP3, WAV, ਜਾਂ OGG ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰ ਸਕਦਾ ਹੈ।

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 3-4GB
  • Credits/1000 chars 25

Try F5- TTS Now

Generate your first audio free. No credit card required.

Start Free