F5- TTS

Premium

වේගවත්, දියුණු, සහ ක්ලෝන කිරීම සමග විශ්වාසවන්ත පෙළ-කථාව

Fast වේගය
Very Good ගුණාත්මකභාවය
ඔව් ක්ලෝන කිරීම
5 භාෂා

ගැන F5- TTS

ability. It is based on the F5-TTS model, which is the most widely used text-to-speech model in the world. The model is based on the F5-TTS model, which is the most widely used text-to-speech model in the world. The F5-TTS model is based on the F5-TTS model, which is the most widely used text-to-speech model in the world

ප්රධාන විශේෂාංග

වේගවත් ජනනය

සරල ව්‍යුහයක් සහිත ද්‍රව්‍යයක් සරල ව්‍යුහයක් සහිත ද්‍රව්‍යයක් ලෙස හැඳින්වේ.

ශූරතාවය

කෙටි ශ්රව්ය සාම්පලයක් කිසිදු හඬක් ක්ලෝන සකස්-හැඩගැස්වීමකින් තොරව.

අධි විශ්වාසය

ඵලදායිතාවය යනු ඵලදායිතාවය හා ස්වභාවික සම්පත් වල ගුණාත්මකභාවය අතර ඇති සම්බන්ධතාවයයි.

ස්වභාවික දියුණුව

ස්වභාවික හා ව්‍යුහාත්මක හේතූන් නිසා ඇතිවන වේදනාව.

බහුභාෂා

ස්වභාවික වචන භාවිතයෙන් භාෂා කිහිපයකට සහාය දක්වයි.

විවෘත මූලාශ්‍ර

සම්පූර්ණ වෙළඳ දැන්වීම් බලපත්‍රයක් ලබා ගැනීම.

භාවිතය

අන්තර්ගත නිර්මාණය වීඩියෝ ඩබ්ලිව් ශ්රව්ය පොත් නිෂ්පාදනය පොඩ්කාස්ට් ජනනය පුද්ගලික සහායක තත්කාල යෙදුම්Name

භාවිතා කරන ආකාරය F5- TTS

  1. 1

    නොමිලේ ලියාපදිංචි වන්න හෝ දර්ශන විවෘත කරන්න

    ආරම්භක ණය ලබා ගැනීමට නොමිලේ TextToSpeechAI ගිණුමක් නිර්මාණය කරන්න, හෝ අවශ්ය ගෙවීමක් නොමැතිව F5-TTS උත්සාහ කිරීමට නිදහස් ව්යාපාර ක්රමයට කෙලින්ම පැනීම.

  2. 2

    F5-TTS තෝරන්න සහ (විකල්ප) උපුටා දැක්වීමක් ක්ලිප් උඩුගත

    ඔබේ එන්ජිම ලෙස F5-TTS තෝරන්න. හඬක් ක්ලෝන කිරීමට, F5-TTS ඔවුන්ගේ කටහඬ හා ඇක්සෙන්ට් ශුන්‍ය-ෂොට් අල්ලා ගත හැකි නිසා ඉලක්ක කථානායක කෙටි 10-30 තත්පර අනුසාරයෙන් නියැදියක් උඩුගත; තනන ලද F5-TTS හඬක් භාවිතා කිරීමට මෙම පියවර අමතක කරන්න.

  3. 3

    ඔබේ පෙළ ඇතුළත් කරන්න

    ඔබ කතා කිරීමට අවශ්ය පෙළ ටයිප් හෝ ඇලවීම. F5-TTS ඔබේ තෝරාගත් හෝ ක්ලෝන හඬ එය ස්වභාවිකව කියවනවා, බහු සහාය භාෂා හරහා සුමට prosody සමග.

  4. 4

    කථාව ජනනය කරන්න

    ක්ලික් කරන්න ජනනය සහ F5-TTS අපගේ GPU යටිතල පහසුකම් මත ඉක්මනින් ඔබේ ශබ්දය සංස්ලේෂණය, 25 ක්රොඩ් සඳහා 1000 අක්ෂර ව්යාපාරික අනුපාතය මත බිල්පත්.

  5. 5

    API බාගත හෝ භාවිතා කරන්න

    MP3 ලෙස අවසන් ශ්රව්ය බාගත, WAV, හෝ OGG, හෝ ඔබේම යෙදුම් ජනනය ස්වයංක්රීය කිරීමට ඔබේ F5-TTS හඬ ID සමඟ TextToSpeechAI API ඇමතුම්.

F5- TTS API

TextToSpeechAI REST API භාවිතා කරමින් වැඩසටහන්ගතව කථාව ජනනය කරන්න.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "F5\u002DTTS වේගවත්, තීව්‍ර හඬ ක්ලෝන කිරීමේ හැකියාවන් සමග සරල කථාව ලබා දෙයි.",
    "voice": "en_US-lessac-medium"
  }'

නිතර අසන ප්රශ්න

F5-TTS (Fast, Fluent, Faithful TTS) යනු කාර්යක්ෂම, උසස් තත්ත්වයේ කථන සංස්ලේෂණය සඳහා ගලා යාම ගැලපීම භාවිතා කරන නවීන පෙළ-කථන ආකෘතියකි. එය ශූරතාව-ෂොට් හඬ අනුකරණය සහ සාම්ප්රදායික autoregressive ආකෘති වලට වඩා වේගවත් ස්වභාවික කථාව ජනනය කිරීමට සහාය වේ. TextToSpeechAI මත, F5-TTS හඬ අනුකරණය සඳහා භාවිතා පෙරනිමි එන්ජිම වේ.

F5-TTS හඬ ශූරතාවය-ෂොට් ක්ලෝන, කිසිදු පුහුණු අවශ්ය සමග: ඔබ ඉලක්ක කථානායක කෙටි උපුටා වාර්තාවක් උඩුගත, හා ආකෘතිය පියාසර ඔවුන්ගේ ශ්රව්ය ලක්ෂණ ඉවත්. එය පසුව එම ක්ලෝන හඬ ඕනෑම පෙළ සංස්ලේෂණය, ටෝන් අල්ලා, හඬ, සහ නියැදියෙන් prosody.

F5-TTS පිරිසිදු කථාව තත්පර 10 ක් 30 ක් පමණ කෙටි උපුටා දැක්වීමක් ක්ලිප් සිට හඬක් ක්ලෝන කළ හැකි. පැහැදිලි, ශබ්ද-නිදහස් පටිගත වඩාත් විශ්වාසවන්ත ප්රතිඵල නිපදවයි, ඔබ පැරණි ක්ලෝන පද්ධති කළ ආකාරය පුහුණු දත්ත පැය අවශ්ය නැත.

ඔව්. F5-TTS කේතය MIT බලපත්ර, සහ TextToSpeechAI OpenF5-TTS-Base බර ධාවනය, වන වාණිජ වශයෙන් ඉඩ අප් රේක අප් චා 2.0 බලපත්ර යටතේ නිකුත් කර ඇත. එම සංයෝජනය F5-TTS වාණිජ නිෂ්පාදන භාවිතා කිරීමට ආරක්ෂිත කරයි, ඔබ ක්ලෝන ඕනෑම හඬට හිමිකම් ඇති බව සපයයි.

ඔව්. F5-TTS ස්වයං-පසුබස්වන නොවන ප්රවාහය ගැලපෙන ගෘහ නිර්මාණ ශිල්පය භාවිතා කරයි, ඒ නිසා එය බාර්ක් හෝ ටර්ටෝයිස් වැනි ස්වයං-පසුබස්වන ආකෘති වලට වඩා බොහෝ වේගයෙන් කථාව ජනනය කරයි. තවමත් ස්වභාවික ශබ්දයක් ඇති අතර එය තත්ත්ව සහ අධික පරිමාව වැඩ බර සඳහා සුදුසු වේ.

F5-TTS ස්වභාවික prosody, සුමට රිද්මය, සහ පැහැදිලි සංකල්ප සමග උසස් තත්ත්වයේ ශබ්ද නිපදවයි. එය ගුණාත්මක හා වේගය විශිෂ්ට සමතුලිතතාවයක් පහර, බොහෝ අන්තර්ගතය සඳහා එය ශක්තිමත් පෙරනිමියක් බවට පත්, කථාව, හා ක්ලෝන භාවිතය නඩු.

F5-TTS VRAM මත වේගවත් හා සැහැල්ලු වේ, ඔබ ඉක්මන් හැරීම හෝ විශාල කණ්ඩායම් අවශ්ය විට එය පරිපූර්ණ වන අතර, එය TextToSpeechAI ගේ පෙරනිමි ක්ලෝන එන්ජිම වේ. StyleTTS2 අමු විශ්වාසය මත F5-TTS පිටතට ඉඩ හැකි අතිරේක ස්ථර එන්ජිම වේ, එබැවින් වේගය හා පිරිවැය වඩා වැඩි උපරිම ගුණාත්මක කාරණා විට StyleTTS2 තෝරා.

F5-TTS ස්වභාවික උච්චාරණය සමග ඉංග්රීසි, චීන, සහ වෙනත් භාෂා කිහිපයක් සහාය. එය ද හරස්-භාෂා ක්ලෝන හසුරුවනු, ඔබ මුල් උපුටා පටිගත වෙනස් භාෂාවක් කතා කිරීමට ක්ලෝන හඬ භාවිතා කිරීමට ඉඩ.

F5-TTS මතකය කාර්යක්ෂම වන අතර, සාමාන්‍යයෙන් VRAM 4-6GB අවශ්‍ය වේ. TextToSpeechAI හි සියලු පරම්පරාවන් අපගේ GPU යටිතල පහසුකම් මත ධාවනය වන අතර, එය භාවිතා කිරීමට ප් රදේශීය GPU අවශ් ය නොවේ.

F5-TTS TextToSpeechAI මත වාරික-පන්ති එන්ජිම වේ, 25 ක්රොඩ් 1000 අක්ෂර සඳහා බිල්පත්. නව ගිණුම් නොමිලේ ආරම්භක ක්රොඩ් ලැබෙනු ඇත, ඔබ F5-TTS පරීක්ෂා කළ හැකි නිසා, හඬ ක්ලෝන කිරීම ඇතුළු, වැඩි මිලදී ගැනීමට පෙර.

ඔව්. ඔබ නිදහස් ව්යාපාර ක්රියාවලිය හරහා F5-TTS උත්සාහ කළ හැක TextToSpeechAI කිසිදු ගෙවීමක් නොමැතිව, සහ නිදහස් ගිණුමක් නිර්මාණය ඔබ කතා උත්පාදනය හා හඬ ක්ලෝන කළ හැකි නිසා ආරම්භක ණය ලබා දෙයි. ඔබ වැඩි අක්ෂර අවශ්ය විට පමණක් උසස්.

අපගේ පුස්තකාලයේ පවතින F5-TTS හඬ තෝරන්න, හෝ උපුටා ශ්රව්ය උඩුගත කිරීමෙන් ක්ලෝන හඬ නිර්මාණය, පසුව ඔබේ API ඉල්ලීම් එම හඬ ID ලබා. F5-TTS නිමැවුම් ස්වදේශීය WAV, සහ TextToSpeechAI MP3 ආපසු හැක, WAV, හෝ ස්වයංක්රීය පරිවර්තනය සමග OGG.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 3-4GB
  • Credits/1000 chars 25

Try F5- TTS Now

Generate your first audio free. No credit card required.

Start Free