F5- TTS
Premiumਕਲੋਨਿੰਗ ਨਾਲ ਤੇਜ਼, ਸੁਖਾਲਾ ਅਤੇ ਭਰੋਸੇਯੋਗ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚName
ਬਾਰੇ F5- TTS
ability. It is based on the F5-TTS model, which is the most widely used text-to-speech model in the world. F5-TTS is the first text-to-speech model to be developed for the
ਮੁੱਖ ਫੀਚਰ
ਤੇਜ਼ ਨਿਰਮਾਣ
ਤੇਜ਼ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਲਈ ਗ਼ੈਰ- ਆਟੋਰਿਗਰੇਸਿਵ ਆਰਕੀਟੈਕਚਰ ਹੈ । Name
ਜ਼ੀਰੋ- ਸ਼ੋਟ ਕਲੋਨਿੰਗ
ਬਿਨਾਂ ਫਿਨ-ਟੂਨਿੰਗ ਦੇ ਛੋਟੇ ਆਡੀਓ ਸੈਮਪਲ ਤੋਂ ਕੋਈ ਵੀ ਆਵਾਜ਼ ਕਲੋਨ ਕਰੋ ।
ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ
ਫਲੋ ਮੇਲਿੰਗ ਕੁਦਰਤੀ, ਉੱਚ ਕੁਆਲਟੀ ਬੋਲੀ ਆਉਟਪੁੱਟ ਦਿੰਦੀ ਹੈ ।
ਕੁਦਰਤੀ ਤਰੱਕੀ
ਸਮੁੱਚੇ ਰੂਪ ਵਿੱਚ ਸੁੰਦਰ ਪਰੋਸੋਡੀ ਅਤੇ ਕੁਦਰਤੀ ਰੀਥਮ।
ਬਹੁ- ਭਾਸ਼ਾ
ਕੁਦਰਤੀ ਉਚਾਰਨ ਨਾਲ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।
ਖੋਲ੍ਹੋ ਸਰੋਤ
MIT ਲਾਈਸੈਂਸ ਪੂਰੀ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਹੈ ।
ਵਰਤੋਂ ਕੇਸ
ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ F5- TTS
-
1
ਮੁਫ਼ਤ ਰਜਿਸਟਰ ਕਰੋ ਜਾਂ ਡੈਮੋ ਖੋਲ੍ਹੋ
ਸਟਾਰਟਅੱਪ ਕਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮੁਫਤ TextToSpeechAI ਖਾਤਾ ਬਣਾਓ, ਜਾਂ ਮੁਫਤ ਡੀਮੋ ਵਿੱਚ ਸਿੱਧਾ ਜਾਓ F5-TTS ਨੂੰ ਕੋਈ ਭੁਗਤਾਨ ਲੋੜੀਦਾ ਨਾ ਹੋਣ ਨਾਲ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ।
-
2
F5- TTS ਚੁਣੋ ਅਤੇ (ਚੋਣਵਾਂ) ਇੱਕ ਹਵਾਲਾ ਕਲਿੱਪ ਅੱਪਲੋਡ ਕਰੋ
ਆਪਣੇ ਇੰਜਣ ਵਜੋਂ F5- TTS ਚੁਣੋ । ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ, ਟਿਕਾਣੇ ਸਪੀਕਰ ਦਾ ਇੱਕ ਛੋਟਾ 10- 30 ਸਕਿੰਟ ਰਿਫਰੈਸ਼ਨ ਸੈਪਲ ਅੱਪਲੋਡ ਕਰੋ ਤਾਂ ਕਿ F5- TTS ਉਨ੍ਹਾਂ ਦਾ ਟੋਨ ਅਤੇ ਐਕਸਟੈਂਸ਼ਨ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਲੈ ਸਕੇ । ਇੱਕ ਅੰਦਰੂਨੀ F5- TTS ਆਵਾਜ਼ ਵਰਤਣ ਲਈ ਇਹ ਕਦਮ ਛੱਡੋ ।
-
3
ਆਪਣਾ ਟੈਕਸਟ ਦਿਓ
ਟੈਕਸਟ, ਜੋ ਕਿ ਤੁਸੀਂ ਬੋਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਨੂੰ ਟਾਈਪ ਕਰੋ ਜਾਂ ਚੇਪੋ । F5- TTS ਇਸ ਨੂੰ ਤੁਹਾਡੀ ਚੁਣੀ ਜਾਂ ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਸੁਣਾਉਂਦਾ ਹੈ, ਕਈ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਸਧਾਰਨ ਪਰੋਸੌਡੀ ਨਾਲ ।
-
4
ਬੋਲੀ ਬਣਾਓ
F5-TTS ਸਾਡੇ GPU ਇੰਫਰਾਸਟਰਕਚਰ ਉੱਤੇ ਤੇਜ਼ੀ ਨਾਲ ਆਡੀਓ ਸੰਸਲੇਸ਼ਣ ਕਰਦਾ ਹੈ, ਪ੍ਰੀਮੀਅਮ ਰੇਟ 25 ਕ੍ਰੈਡਿਟ ਪ੍ਰਤੀ 1000 ਅੱਖਰ ਹੈ।
-
5
API ਡਾਊਨਲੋਡ ਜਾਂ ਵਰਤੋਂ
MP3, WAV ਜਾਂ OGG ਦੇ ਰੂਪ ਵਿੱਚ ਆਡੀਓ ਡਾਊਨਲੋਡ ਕਰੋ, ਜਾਂ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਆਟੋਮੈਟਿਕ ਬਣਾਉਣ ਲਈ F5-TTS ਵੌਇਸ ID ਨਾਲ TextToSpeechAI API ਕਾਲ ਕਰੋ।
F5- TTS API
TextToSpeechAI REST API ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਗਰਾਮਿਕ ਤੌਰ ਉੱਤੇ ਬੋਲੀ ਬਣਾਓ । Name
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "F5\u002D TTS ਤੇਜ਼, ਬੋਲਣਯੋਗ ਭਾਸ਼ਾ ਨਾਲ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਸਮਰੱਥਾ ਦਿੰਦਾ ਹੈ ।",
"voice": "en_US-lessac-medium"
}'
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 3-4GB
- Credits/1000 chars 25