TTS වාදකය

Standard

ස්වාභාවික prosody සමග වේගවත් බහු- හඬ TTS

Very Fast වේගය
Good ගුණාත්මකභාවය
නෑ ක්ලෝන කිරීම
6 භාෂා

ගැන TTS වාදකය

[Translation temporarily unavailable. Please try again.]

ප්රධාන විශේෂාංග

බහු- උපසර්ග

බහුතරයක් ඉංග්‍රීසි වදන් ඇමරිකානු, බ්‍රිතාන්‍ය, ඉන්දියානු, ඕස්ට්‍රේලියානු ආදී ලෙස වෙනස් වේ.

CPU සැබෑ- කාලය

CPU හි ධාරිතාවය වැඩි කිරීම සඳහා GPU හි ධාරිතාවය අඩු කිරීම.

භාෂා 6

ඉංග්රීසි, ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන් සහ කොරියානු සහාය.

වේග පාලකය

සරලව කිවහොත් විද්‍යුත් චුම්භක තරංගය විද්‍යුත් චුම්භක ක්ෂේත්‍රයක් ලෙස හැඳින්වේ.

භාවිතය

බහු- හඬ භාවිත යෙදවුම්Name ජාත්යන්තර අන්තර්ගතය දේශීයකරණය තත්කාලීන හඬ සහායක කටහඬ විවිධත්වය සමඟ ශ්රව්ය පොත් නිෂ්පාදනය

භාවිතා කරන ආකාරය TTS වාදකය

  1. 1

    නොමිලේ ලියාපදිංචි වන්න හෝ දර්ශනය උත්සාහ කරන්න

    නිදහස් TextToSpeechAI ගිණුමක් ආරම්භක ණය ලබා ගැනීමට නිර්මාණය කරන්න, හෝ MeloTTS පරීක්ෂා කිරීමට ඉක්මනින් නිවස පිටුව මත කිසිදු ලියාපදිංචිය ඩෙමෝ භාවිතා. ඔබ වගකිව යුතු පෙර MeloTTS විවිධ අක්ෂර අගය කිරීමට ප්රමාණවත් නිදහස් ණය වේ.

  2. 2

    MeloTTS හඬ සහ හඬ තෝරන්න

    MeloTTS හඬ බ්රවුසරයේ විවෘත සහ පෙරහන්. ඔබගේ ප් රේක්ෂකයින් ගැලපෙන බව හඬ තෝරන්න, එවැනි ඇමරිකානු, බ්‍රිතාන්‍ය, ඉන්දියානු, හෝ ඕස්ට්රේලියානු ඉංග්රීසි, හෝ ස්වදේශීය ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, හෝ කොරියානු හඬ.

  3. 3

    ඔබේ පෙළ ඇතුළත් කරන්න

    ඔබ පෙළ කොටුව තුළ voiced කිරීමට අවශ්ය ස්ක්රිප්ට් වර්ග හෝ ඇලවීම. MeloTTS ස්වභාවික prosody ස්වයංක්රීයව හසුරුවයි, ඔබ ඔබේ තෝරාගත් උච්චාරණය සඳහා fine-tune pacing කතා වේගය වෙනස් කළ හැකිය.

  4. 4

    ශ්‍රව්‍යය ජනනය කරන්න

    ක්ලික් කරන්න ජනනය සහ MeloTTS සැබෑ කාලය තුළ ඔබේ කථාව සංස්ලේෂණය. එය CPU මත කාර්යක්ෂමව ධාවනය නිසා, ප්රතිඵල දිගු මාර්ග පවා සඳහා වේගයෙන් ආපසු පැමිණෙන, හා රැකියා වියදම් 10 ක්රෙඩිට් සඳහා 1,000 අක්ෂර.

  5. 5

    API බාගත හෝ භාවිතා කරන්න

    ප්රතිඵලය නැවත වාදනය, ඉතිහාසය පිටුව සිට ඔබ කැමති ආකෘතිය තුළ ශ්රව්ය ගොනුව බාගත. ඔබේම යෙදුම් MeloTTS ස්වයංක්රීය කිරීමට, api.texttospeechai.com දී TextToSpeechAI REST API කතා, ඔබේ ගිණුම API ටෝකනය භාවිතා.

TTS වාදකය API

TextToSpeechAI REST API භාවිතා කරමින් වැඩසටහන්ගතව කථාව ජනනය කරන්න.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "MeloTTS ස්වභාවිකව ලෝකය පුරා සත්ය අක්ෂර වින්‍යාසය සමග කතා කරයි.",
    "voice": "en_US-lessac-medium"
  }'

නිතර අසන ප්රශ්න

MeloTTS යනු බහු-අක්ෂර ශ් රව්ය සංස්ලේෂණය පිළිබඳ විශේෂඥ වන MyShell AI හි වේගවත් පෙළ-කථන ආකෘතියකි. එය ඉංග් රීසි සඳහා අක්ෂර කිහිපයක් වෙනස්කම් සමඟ බහු භාෂා සහාය, සැබෑ-කාල වේගයෙන් ස්වභාවික prosody නිෂ්පාදනය.

ඔව්. MeloTTS MIT බලපත්රය යටතේ නිකුත් කර ඇත, කේතය හා ආකෘතිය බර දෙකම ආවරණය. ඔබ රාජ්ය හෝ බෙදාහැරීමේ අවශ්යතා නොමැතිව වාණිජ නිෂ්පාදන එය නිදහස් භාවිතා කළ හැකිය.

MeloTTS ඇමරිකානු සහාය, බ්‍රිතාන්‍ය, ඉන්දියානු, සහ ඕස්ට්රේලියානු ඉංග්රීසි හඬ. එය ද ස්පාඤ්ඤය සඳහා ස්වදේශීය හඬ ඇතුළත්, ප්රංශ, චීන, ජපන්, සහ කොරියානු, එය ජාත්යන්තර යෙදුම් සඳහා සුදුසු වන.

MeloTTS භාෂා හයක් ආවරණය: ඉංග්රීසි, ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු. ඉංග්රීසි හඬ මූලික භාෂාව ඉහළ සත්ය ප්රාදේශීය අක්ෂර එකතු, ඒ නිසා තනි ආකෘතිය බොහෝ වෙළඳපොළ හැසිරවීම.

ඔව්. MeloTTS සැබෑ-කාලීන සංස්ලේෂණය සඳහා නිර්මාණය කර ඇති අතර CPU මත පවා වාදනය වඩා වේගවත් කතා උත්පාදනය. මෙම සජීවී හඬ සහායක, chatbots, සහ ව්යාපාර යෙදුම් සඳහා ශක්තිමත් ගැලපෙන කරයි.

MeloTTS හොඳ නිෂ්පාදනය, පැහැදිලි prosody සහ නිවැරදි හඬින් ස්වභාවික හඬ කථාව. එය StyleTTS2 හෝ Tortoise වැනි මන්දගාමී ආකෘති අති-උසස් විශ්වාසවන්තත්වයට වඩා වේගය සහ හඬින් විවිධ ප්රමුඛතාවය, ප්රතිචාරය වඩාත් වැදගත් විට එය කදිම වේ.

නැහැ, MeloTTS හඬ ක්ලෝන නොකරයි. එය පෙර සැකසූ කථිකයන් සහ හඬවල් ස්ථාවර කට්ටලයක් භාවිතා කරයි. TextToSpeechAI මත හඬ ක්ලෝන කිරීම සඳහා, F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, හෝ Tortoise වෙනුවට භාවිතා කරන්න.

GPU අවශ්ය නොවේ. MeloTTS මතක 500MB පමණ භාවිතා කරමින් CPU මත පහසුවෙන් ක්රියාත්මක වන අතර සැබෑ කාලය පවතී. GPU විකල්ප වන අතර අමතර වේගය පමණක් එකතු; ඔබ එක් භාවිතා කිරීමට තෝරා ගන්නේ නම් VRAM 500MB පමණ ප්රමාණවත් වේ.

MeloTTS TextToSpeechAI මත සම්මත-පන්තියේ එන්ජිමක් වේ, 10 ක්රොඩ් 1,000 අක්ෂර සඳහා බිල්පත්. ඒ අඩුම මිල ස්ථරය, Piper වැනි වෙනත් සැහැල්ලු CPU ආකෘති ගැලපෙන, VITS, හා Kokoro.

MeloTTS සහ Kokoro යන දෙකම වේගවත්, සම්මත ණය ස්ථරය මත MIT / Apache-බලපත්ර CPU ආකෘති වේ. ඔබ වෙනස් ඉංග්රීසි හඬ අවශ්ය විට MeloTTS තෝරන්න (ඇමරිකානු, බ්‍රිතාන්‍ය, ඉන්දියානු, ඕස්ට්රේලියානු); එහි පුළුල් බහුභාෂා හඬ වර්ග සඳහා Kokoro තෝරන්න. දෙකම TextToSpeechAI මත A / B පරීක්ෂණය පහසු වේ.

MeloTTS උච්චාරණය විවිධ හා බහුභාෂා ආවරණය දී විශිෂ්ට, Piper විශාලතම පෙර සැකසූ හඬ පුස්තකාලය ලබා දෙන අතර. දෙකම වේගවත් හා සම්මත ස්ථරය මත CPU-සහගත වේ, ඔබ වෙනස් හඬවල් පුළුල්තම තෝරා ගැනීමට අවශ්ය විට උච්චාරණය-විශේෂී ව්යාපෘති සඳහා MeloTTS හා Piper තෝරා.

ඔව්. නව TextToSpeechAI ගිණුම් නිදහස් ආරම්භක ණය ඇතුළත්, හා ඔබ ලියාපදිංචි තොරව භාවිතා කළ හැකි ෙප්රදර්ශන ඇත. එම MeloTTS අක්ෂර හා හඬ පරීක්ෂා කිරීමට ප්රමාණවත් අමතර ණය හෝ දායක මිලදී ගැනීමට පෙර.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try TTS වාදකය Now

Generate your first audio free. No credit card required.

Start Free