ඵල

Premium

හැඟීම් සහ ශබ්ද බලපෑම් සමග ප්රකාශාත්මක AI කථාව

Slow වේගය
Very Good ගුණාත්මකභාවය
නෑ ක්ලෝන කිරීම
13 භාෂා

ගැන ඵල

-text audio. Bark is the first TTS model to use the

ප්රධාන විශේෂාංග

හැඟීම් ප්‍රකාශනය

හිනාව, සිනා, gasps, හා සැබෑ හැඟීම් සමග කථාව ජනනය.

හැඟීම් සලකුණු

[හිනාව] භාවිතා කරන්න, [සිනා], අවධාරණය සඳහා කැප්ස්, සහ... පසුබට වීම සඳහා.

බහුභාෂා

ස්වාභාවික අක්ෂර හා උච්චාරණය සමග 13+ භාෂා සහාය.

සංගීතය සහ අලංකාරName

සංගීතය හා චිත්‍ර කලාව පහසුවෙන් ඉගෙන ගත හැක.

කථාකරන්නා පෙරනිමි

Multiple pre-trained speaker voices with different styles.

විවෘත මූලාශ්‍ර

සම්පූර්ණ වෙළඳ භාවිත අයිතිය MIT බලපත්‍රය යටතේ පවතී.

භාවිතය

අකුරු සංවාදය සජීවීකරණය කළ අන්තර්ගතය ශ්‍රව්‍ය පොත් විස්තරය ගේම් හඬ ක්‍රියාකාරිත්වය නිර්මාණාත්මක ව්‍යාපෘතිName ප්‍රකාශන සහායක

ඵල Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

භාවිතා කරන ආකාරය ඵල

  1. 1

    නොමිලේ ලියාපදිංචි වී demo විවෘත කරන්න

    නිදහස් TextToSpeechAI ගිණුමක් නිර්මාණය ඔබේ ආරම්භක ණය ඉල්ලා, හෝ වහාම බාර්ක් උත්සාහ කිරීමට කිසිදු ලියාපදිංචිය දර්ශනය භාවිතා. ඔබ උසස් කිරීමට පෙර නිදහස් ණය කිහිපයක් ප්රකාශාත්මක බාර්ක් ක්ලිප් ජනනය කිරීමට ප්රමාණවත් වේ.

  2. 2

    බර්ක් හඬක් තෝරන්න

    හඬ පුස්තකාලය විවෘත හා ඔබ කැමති හඬ ගැලපෙන බව බාර්ක් කථානායක පෙර සැකසුම් තෝරා. බාර්ක් හඬවල් දීමනා ස්ථරය ලෙස ලකුණු කර ඇත (25 ක් 1000 අක්ෂර) හා මානසික සඳහා සකස් කර ඇත, චරිතය-ශෛලිය කතාව.

  3. 3

    හැඟීම් සලකුණු සහිත පෙළ ඇතුළත් කරන්න

    ඔබේ ස්ක්රිප්ට් වර්ග හා බාර්ක් හැඟීම් සලකුණු inline embed: හිනාව සඳහා [සිනහව], [සිනා] සිහින් සිහින්, [gasps] gasps සඳහා,... විරාම සඳහා, හා අවධාරණය සඳහා කැප්ස්. උදාහරණයක් ලෙස: "ඔහ් වොව්! [සිනහව] මේ පුදුම... මම එය විශ්වාස කරන්න බැහැ!"

  4. 4

    ශ්‍රව්‍යය ජනනය කරන්න

    ක්ලික් කරන්න ජනනය හා බාර්ක්, ගැලපෙන ශබ්දයට එක් එක් සලකුණක් හරවා, ප්රකාශාත්මක කථාව බවට ඔබේ පෙළ ප්රදර්ශනය. පරම්පරාව බාර්ක්ගේ පරිවර්තක ආකෘතිය නිසා සැහැල්ලු එන්ජින් වඩා මන්දගාමී වේ, එබැවින් වාක්‍යයකට අමතර තත්පර කිහිපයක් ඉඩ.

  5. 5

    API බාගත හෝ භාවිතා කරන්න

    ප්රතිඵලය ප්රතිචාර පරීක්ෂා, පසුව MP3 ලෙස එය බාගත, WAV, හෝ OGG. ඔබේම යෙදුම් බර්ක් ස්වයංක්රීය කිරීමට, බර්ක් හඬ සහ එම ලකුණ-පොහොසත් පෙළ නැවත ප්රකාශාත්මක ශබ්ද ලබා ගැනීමට TextToSpeechAI API ඇමතුම්.

ඵල API

TextToSpeechAI REST API භාවිතා කරමින් වැඩසටහන්ගතව කථාව ජනනය කරන්න.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ඔහ් වොව්! [සිනහ] මේක පුදුමයක්... මම මේ සද්දේ කොච්චර ප්‍රකාශාත්මකද කියලා ආදරය කරනවා!",
    "voice": "bark-zh_0"
  }'

නිතර අසන ප්රශ්න

බාර්ක් සුනෝ විසින් නිර්මාණය කරන ලද පරිවර්තකය පදනම් කරගත් පෙළ-ශබ්ද ආකෘතිය වේ. සාම්ප්රදායික TTS පද්ධති මෙන් නොව, බාර්ක් ස්වභාවික හැඟීම් සමග ඉතා ප්රකාශාත්මක කථාව ජනනය, හිනාව, සිනා, සහ වෙනත් වචනයෙන් නොවන ශබ්ද. එය පවා සංගීතය හා ශබ්ද බලපෑම් ජනනය කළ හැකිය.

ඔව්, බාර්ක් MIT බලපත්රය යටතේ විවෘත මූලාශ්රය වේ, නිදහස් වාණිජමය භාවිතය ඉඩ. මත TextToSpeechAI, අපි අයකර 25 ක්රෙඩිට් 1000 අක්ෂර නිසා ජනරජය සඳහා අවශ්ය සැලකිය යුතු GPU සම්පත්.

බාර්ක් සහාය 13+ ඉංග්රීසි ඇතුළු භාෂා, ජර්මානු, ස්පාඤ්ඤ, ප්රංශ, හින්දි, ඉතාලි, ජපන්, කොරියානු, පෝලන්ත, පෘතුගීසි, රුසියානු, තුර්කි, සහ චීන. එක් එක් භාෂාව ස්වභාවික උච්චාරණය සහ හඬින් ඇත.

බර්ක් එහි autoregressive පරිවර්තක ගෘහ නිර්මාණ ශිල්පය නිසා බොහෝ TTS එන්ජින් වඩා මන්දගාමී වේ. සාමාන්ය වාක්‍ය GPU මත ජනනය කිරීමට තත්පර 5-15 ගත වේ. ටෙස්ට් සාමාන්යයෙන් වඩාත් ප්රකාශාත්මක හා ස්වභාවික ප්රතිදානය වේ.

බාර්ක් "සමාජීය ප්රශ්න" සහ කථානායක පෙරනිමි හරහා සීමිත හඬ ක්ලෝන කිරීම පමණක් ලබා දෙයි, ඒ නිසා එය විශ්වාසනීය ලෙස සාම්පලයක් සිට ඕනෑම හඬක් ක්ලෝන කළ නොහැකි. සම්පූර්ණ හඬ ක්ලෝන කිරීම ඔබේ ඉලක්කය නම්, F5-TTS භාවිතා, StyleTTS2, OpenVoice, හෝ ටර්ටෝයිස් වෙනුවට, TextToSpeechAI මත සියලුම ලබා ගත හැක.

බර්ක් ඔබේ පෙළ තුල සෘජුවම තබා ඇති රේඛීය සලකුණු කියවා ඒවා ගැලපෙන ශබ්ද බවට හරවයි. හිනාව සඳහා [සිනහව] භාවිතා කරන්න, සිනා සඳහා [සිනහව], සිනා සඳහා [ගෑස්] භාවිතා කරන්න,... සැක සහිත හෝ විරාමයක් සඳහා, සහ අවධාරණය සඳහා CAPS. උදාහරණයක් ලෙස: "ඔහ්, වොව්! [සිනහව] මෙය පුදුම සහගතයි... මට එය විශ්වාස කළ නොහැක!"

සරල කථාව ඉක්මවා, බාර්ක් හිනාව වැනි වචනයෙන් නොවන ශබ්ද නිපදවිය හැක, සිනා, gasps, ශ්වසන අවහිර, හා stutters, මෙන්ම සරල සංගීතය හා පාරිසරික බලපෑම්. මෙම වැනි සලකුණු සමඟ ආරම්භ කරනු ලැබේ [හිනාව], [සිනා], හා [gasps] පෙළ තුළ embedded, වන බාර්ක් සම්මත TTS වඩා වඩාත් ප්රකාශාත්මක හැඟීමක් ඇති කරයි දේ.

බාර්ක් මානසික අන්තර්ගතය සඳහා මිනිස් කථාව තරග කරන ස්වභාවික ප්රකාශන හැකියාව ඉතා හොඳ තත්ත්වයේ ශබ්ද නිපදවයි. මෙම 24kHz ප්රතිදානය වෘත්තීය ශබ්ද, පිරිසිදු කථාව ගුණාත්මක සුළු වශයෙන් පහත StyleTTS2 වුවත්.

බාර්ක් VRAM ආකෘතිය ප්රමාණයට අනුව 8-12GB අවශ්ය වේ. පූර්ණ ආකෘතිය ~ 12GB අවශ්ය, කුඩා විකල්ප 8GB සමඟ වැඩ කරන අතර. CPU නිගමනය ඉතා මන්දගාමී වන අතර නිර්දේශ නොකෙරේ.

ඔව්, බාර්ක් MIT බලපත්ර ලත්, කිසිදු බලපත්ර ගාස්තු සමග සීමා රහිත වාණිජ භාවිතය ඉඩ දෙන. ඔබ නිෂ්පාදන බාර්ක් භාවිතා කළ හැක, සේවා, සහ යෙදුම් නිදහස්. මත TextToSpeechAI ඔබ වැඩි ගෙවීමට පෙර ඔබේ ලියාපදිංචි ණය භාවිතා බාර්ක් නිදහස් උත්සාහ කළ හැකිය.

බාර්ක් [හිනාව] හා [සිනා] වැනි හැඟීම් සලකුණු සමග ප්රකාශාත්මක තනි කථානායක කථාව විශිෂ්ට, ඩය [S1] / [S2] සමග බහු කථානායක සංවාදය සඳහා ඉදි කරන අතර, ඩය. හැඟීම් කටහඬ සහ චරිත හඬ සඳහා බාර්ක් තෝරන්න, සහ ආපසු-හා-පසු සංවාද සඳහා ඩය. දෙකම ලබා ගත හැක TextToSpeechAI.

බර්ක් හැඟීම් හා වචනයෙන් තොර ශබ්ද සමග සැබවින්ම ප්රකාශාත්මක කථාව ජනනය කිරීමට එහි හැකියාව තුළ සුවිශේෂී වේ. එය වෙනත් එන්ජින් වඩා මන්දගාමී නමුත් නිර්මාණාත්මක අන්තර්ගතය සඳහා වඩාත් මිනිස්-සමාන ප්රතිඵල නිපදවයි. වේගවත් සංස්ලේෂණය සඳහා, Piper භාවිතා. හඬ ක්ලෝන සඳහා, F5-TTS හෝ OpenVoice භාවිතා.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try ඵල Now

Generate your first audio free. No credit card required.

Start Free