2 වන TTS රටාව

Ultra

ශෛලිය මාරු සමග මිනිස් මට්ටමේ පෙළ-කථාව

Moderate වේගය
Excellent ගුණාත්මකභාවය
ඔව් ක්ලෝන කිරීම
1 භාෂා

ගැන 2 වන TTS රටාව

s. StyleTTS 2 is the first TTS system to use the

ප්රධාන විශේෂාංග

මිනිස් මට්ටමේ ගුණාත්මක

අන්ධ පරීක්ෂණ වලදී මිනිස් පටිගත කිරීම් වලින් වෙන්කර හඳුනාගත නොහැකි කථාව නිපදවයි.

රටා හුවමාරුව

ඕනෑම උපුටා ගැනීමක් ශ්‍රව්‍ය සාම්පලයෙන් කතා කරන ශෛලිය මාරු කරන්න.

ස්වභාවික ව්‍යංජන

සරල,

හඬ ක්ලෝන කිරීම

ක්ලෝන හඬ අසාමාන්‍ය නිරවද්‍යතාව සහ ස්වභාවිකත්වය සමග.

වේගවත් නිගමනය

ස්ථිර ස්ථානගත කිරීම් වලට වඩා ස්ථිර ස්ථානගත කිරීම් වලදී ස්ථිරතාවය වැඩිය.

විවෘත මූලාශ්‍ර

සම්පූර්ණ වෙළඳ භාවිත අයිතිය MIT බලපත්‍රය යටතේ පවතී.

භාවිතය

ශ්‍රව්‍ය පොත් වෘත්තීය කටහඬ චිත්රපට සහ රූපවාහිනී නිෂ්පාදන ඉහළ-අග ප්රචාරණය පොඩ්කාස්ට් නිෂ්පාදනය හඬ ක්රියාකාරීත්වය

2 වන TTS රටාව Voices

View All 6
StyleTTS2 Default
EN
StyleTTS2 Expressive
EN
StyleTTS2 Fast
EN
StyleTTS2 Natural
EN
StyleTTS2 Neutral
EN
StyleTTS2 Quality
EN

භාවිතා කරන ආකාරය 2 වන TTS රටාව

  1. 1

    නොමිලේ ලියාපදිංචි වන්න හෝ දර්ශනය ධාවනය කරන්න

    ආරම්භක ණය ලබා ගැනීමට නොමිලේ TextToSpeechAI ගිණුමක් නිර්මාණය කරන්න, හෝ ඇතුළත් නොකර StyleTTS2 අසන්නට නිවෙස් පිටුව දර්ශනය භාවිතා කරන්න.

  2. 2

    StyleTTS2 එන්ජිම තෝරන්න

    හඬ පුස්තකාලයෙන් StyleTTS2 හඬ තෝරන්න. හඬක් ක්ලෝන කිරීමට, 10-30 තත්පර උපුටා ගැනීමක් උඩුගත සහ StyleTTS2 එහි ශෛලිය මාරු කරනු ඇත.

  3. 3

    ඔබේ පෙළ ඇතුළත් කරන්න

    ඔබ කතා කිරීමට අවශ්ය ස්ක්රිප්ට් ඇලවීම හෝ වර්ග. StyleTTS2 ඉංග්රීසි විශිෂ්ට හා ස්වභාවික prosody ලබා දෙයි, ආතතිය, දිගු වාක්‍ය හරහා හා intonation.

  4. 4

    ශ්‍රව්‍යය ජනනය කරන්න

    ක්ලික් කරන්න ජනනය සහ TextToSpeechAI GPU මත ඔබේ StyleTTS2 ශබ්ද ප්රදර්ශනය. අති-පන්ති StyleTTS2 වියදම් 50 ක්රොඩ් සඳහා 1000 අක්ෂර.

  5. 5

    API බාගත හෝ භාවිතා කරන්න

    MP3 ලෙස අවසන් StyleTTS2 ශබ්ද බාගත, WAV, හෝ OGG, හෝ ස්වයංක්රීය ජන්ම සඳහා ඔබේ StyleTTS2 හඬ සමඟ TextToSpeechAI API කතා කරන්න.

2 වන TTS රටාව API

TextToSpeechAI REST API භාවිතා කරමින් වැඩසටහන්ගතව කථාව ජනනය කරන්න.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "StyleTTS2කතා ස්වභාවික නිසා නිෂ්පාදනය, එය වෘත්තීය මානව පටිගත තරඟ.",
    "voice": "styletts2-default"
  }'

නිතර අසන ප්රශ්න

StyleTTS2 යනු මානව මට්ටමේ කථන සංස්ලේෂණයක් සාක්ෂාත් කර ගන්නා නවීන පෙළ-කථන ආකෘතියකි. එය අන්ධ සවන් පරීක්ෂණවල සැබෑ මානව පටිගත කිරීම් වලින් වෙන් කළ නොහැකි බව කථාව නිපදවීම සඳහා ශෛලිය විසිරීම සහ විරුද්ධාභාස පුහුණුව භාවිතා කරයි. ඔබ TextToSpeechAI මත StyleTTS2 නොමිලේ උත්සාහ කළ හැකිය.

StyleTTS2 TextToSpeechAI මත ලබා ගත හැකි ඉහළම තත්ත්වයේ TTS ශබ්ද නිපදවයි. නිල ඇගයීම් එය මෝස් මත මානව මට්ටමේ ශ්රේණිගත කිරීම් ළඟා (මධ්යම අදහස් ලකුණු) පරීක්ෂණ, ගායකයින් බොහෝ විට සැබෑ මිනිස් කථානායක එය වෙන් කිරීමට නොහැකි සමග. එය එම හේතුව නිසා Tortoise සමග අපගේ අල්ට්රා ටෙරර් පසෙක හිඳී.

ඔව්, StyleTTS2 ශෛලිය මාරු හරහා හඬ ක්ලෝන සහාය. එය හුදෙක් ටයිම්බර් පමණක් නොව, උපුටා නමුත් කතා රටා, රිද්මය, හා උපුටා දැක්වීම ක්ලිප් සිට මානසික ගුණාංග. වඩාත් නිවැරදි StyleTTS2 ක්ලෝන සඳහා පැහැදිලි ශබ්ද තත්පර 10-30 ලබා දීම.

ඔව්. StyleTTS2 කිසිදු රාජ්ය නොවන සම්පූර්ණ වාණිජමය භාවිතය ඉඩ දෙන, ඉඩ MIT බලපත්රය යටතේ නිකුත් කර ඇත. ඒ ශ්රව්ය පොත් සඳහා එය ආරක්ෂිත කරයි, ප්රචාරණය, චිත්රපට, හා අයිතිවාසිකම් කාරණය වන වෙනත් වෘත්තීය StyleTTS2 ව්යාපෘති.

StyleTTS2 ප් රධාන වශයෙන් ඉංග් රීසි සහාය, ආදර්ශ ඉංග් රීසි දත්ත සමුදා පුහුණු කරන ලදී සිට. ඔබ බහු භාෂා හරහා සමාන ගුණාත්මක අවශ්ය නම්, F5-TTS මත TextToSpeechAI තවමත් හඬ ක්ලෝන සහාය වන අතර වඩා හොඳ ගැලපෙන වේ.

StyleTTS2 මධ්යම පරම්පරාවේ වේගය ඇත. එය Tortoise වැනි autoregressive ආකෘති වඩා වේගවත් නමුත් Piper වැනි සැහැල්ලු එන්ජින් වඩා මන්දගාමී වේ. එහි වාරික ගුණාත්මක හා ගණනය පිරිවැය නිසා, StyleTTS2 සැබෑ-කාලීන ආකෘතිය ලෙස නොව අපගේ අල්ට්රා ස්ථරය මිල දී ගනී.

StyleTTS2 අවශ්ය දළ වශයෙන් 4-6GB VRAM නිගමනය සඳහා. එය වඩාත් මතක කාර්යක්ෂම බර්ක් හෝ Tortoise වඩා වැඩි ගුණාත්මක ප් රතිදානය නිපදවන අතර. මත TextToSpeechAI සියලු StyleTTS2 සැකසුම් අපගේ GPUs මත ධාවනය, ඒ නිසා ඔබ ඔබේම කිසිදු දෘඩාංග අවශ්ය නැත.

StyleTTS2 අතිරේක-පන්තියේ ආකෘතිය වන අතර TextToSpeechAI මත 1000 අක්ෂර සඳහා 50 ණය වියදම්. එම වාරික මිලදී ගැනීම එහි මානව මට්ටමේ ගුණාත්මකභාවය සහ අවශ්ය GPU සම්පත් පිළිබිඹු. Piper වැනි සම්මත ආකෘති පිරිවැය 10 ණය 1000 අක්ෂර සංසන්දනය මගින්.

අමු ඉංග්රීසි ශබ්ද ගුණාත්මක ඉහළ ප්රමුඛතාවය වන විට StyleTTS2 තෝරන්න හා ඔබ වඩාත් ස්වභාවික-සවන් ප්රතිඵල අවශ්ය. ඔබ හඬ ක්ලෝන සමඟ වේගවත් බහුභාෂා සංස්ලේෂණය අවශ්ය විට F5-TTS තෝරන්න. දෙකම ක්ලෝන සහාය, නමුත් StyleTTS2 අල්ට්රා ස්ථරය වේ (50 ණය) අතර F5-TTS ව්යාජ ස්ථරය වේ (25 ණය).

StyleTTS2 24kHz දී උසස් තත්ත්වයේ ශබ්ද ජනනය. TextToSpeechAI හරහා ඔබ MP3 ලෙස ප්රතිඵලය බාගත කළ හැකි, WAV, හෝ OGG, අපි උසස් තත්ත්වයේ සංකේතනය භාවිතා, එබැවින් සුවිශේෂී StyleTTS2 ගුණාත්මක අවසන් ගොනුව තුළ පවත්වා ගනී.

ඔව්. StyleTTS2 කතා අනුපාතය වෙනස්කම් සහාය, සහ එහි ශෛලිය-මාරු සැලසුම වෙනස් උපුටා ගැනීම් ක්ලිප් තෝරා ඔබ prosody හැඩය ඉඩ. ඔබ කැමති රිද්මය හා හැඟීම සමග ශබ්ද තෝරා ගැනීම StyleTTS2 බෙදාහැරීම ඔබ හොඳින් පාලනය ලබා දෙයි.

අපගේ පුස්තකාලයෙන් StyleTTS2 හඬක් තෝරන්න හෝ ක්ලෝන හඬක් නිර්මාණය කිරීමට උපුටා දැක්වීමේ ශබ්දය උඩුගත කරන්න, ඉන්පසු ඔබේ API ඉල්ලීම් තුළ එම හඬ උපුටා දක්වන්න. TextToSpeechAI සියලු GPU සැකසුම් හැසිරවීම සහ ඔබේ ප් රතිලාභ StyleTTS2 ශබ්ද සමඟ බාගත URL එකක් ආපසු.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 4-6GB
  • Credits/1000 chars 50

Try 2 වන TTS රටාව Now

Generate your first audio free. No credit card required.

Start Free