ഡിയ

Ultra

ശബ്ദ ശബ്ദവും ശൂന്യമായ ശബ്ദവും ഉപയോഗിച്ചു് ഡയലോഗ്- ഇന്ററാക്റ്റീവ് ടിടിഎസ്

Medium വേഗത
Excellent ഗുണനിലവാരം
അതെ ക്ലോണിങ്ങ്
1 ഭാഷകള്‍

സംബന്ധിച്ച് ഡിയ

Dia നൈ ലാബ്സ് വിന്‍ 160B പരാമീറ്റര്‍ സജീവമായ ഒരു ഡയലോഗ്- ഫോക്കസ്-ഫോള്‍ഡര്‍- മോഡാണ്. ഇത് പ്രകൃതിയിലുള്ള സംഭാഷണം നന്നായി പ്രയോജനപ്രദമാകുന്നു. ചിരി, നെടുവീര്‍പ്പില്ലാത്ത ശബ്ദങ്ങള്‍, നെഞ്ചുകള്‍, ഇനങ്ങള്‍ എന്നിവയ്ക്കു് വേണ്ടിയുള്ള പിന്തുണയോടെ. ഡിവിഡി 5- 10 സെക്കന്‍ഡുകളില്‍ നിന്നുള്ള ഒന്നില്‍ നിന്നും ശബ്ദവിവരക്കണക്കുകള്‍ക്കും ശബ്ദങ്ങള്‍ക്കും ക്രിയകള്‍ക്കും വേണ്ടി പിന്തുണക്കുന്നു. ഇതു് ക്രിയകള്‍ക്കു് അനുയോജിക്കുന്നു.

കീ വിശേഷതകള്‍

ഡയലോഗ് പരമ്പര

സ്വാഭാവികമായ ഒന്നിലധികം ശബ്ദങ്ങള്‍ തമ്മില്‍ വര്‍ണ്ണിപ്പിക്കുക, ശബ്ദങ്ങള്‍ കേള്‍ക്കുക.

ശബ്ദങ്ങള്‍

[ചിഹ്നങ്ങള്‍, [ചിലര, പിണ്ഡങ്ങള്‍, സ്വാഭാവികമായ ഭാവങ്ങള്‍ക്ക് (gaps) കൂട്ടിച്ചേര്‍ക്കുക.

ശബ്ദം ക്ലോണ്‍

സ്വകാര്യ സംസാരത്തിനുള്ള റെക്കോര്‍ഡ് ഓഡിയോയില്‍ നിന്ന് 5-10 സെക്കന്റുകളില്‍ നിന്ന് ശബ്ദം ക്ലിക്ക് ചെയ്യുക.

പ്രകൃതിയുടെ വര്‍ത്തമാനം

160ബി പരാമീറ്റർ പ്രകൃതം സംപ്രേക്ഷണവും സ്ഥായവും ഉത്ഭവിപ്പിക്കുന്നു.

കേസുകള്‍ ഉപയോഗിക്കുക

ഡയലോഗും സംഭാഷണ പരമ്പരയുംComment അനവധി അക്ഷരങ്ങളുള്ള ശബ്ദപുസ്തകം കളിയിലുള്ള അക്ഷരങ്ങളുടെ ശബ്ദം പോസ്റ്റ്‌കാര്‍ഡും ഉള്ളടക്കം സൃഷ്ടിക്കലും

എങ്ങനെ ഉപയോഗിക്കണം? ഡിയ

  1. 1

    ഫ്രീ ആയിക്കോ, അല്ലെങ്കില്‍ ഡീമോ തുറക്ക്.

    നിങ്ങളുടെ തുടക്കക്കാരന്റെ ക്രെഡിറ്റ്‌ എന്ന് അവകാശപ്പെടാന്‍ TextToSpeechAI അക്കൌണ്ട് ഉണ്ടാക്കൂ അല്ലെങ്കില്‍ ഡിയ ഡയലോഗ് പരിശോധിക്കാന്‍ ഒരു സിഗ്നപ്പ് ഡിമോ തുറക്കൂ.

  2. 2

    Dia എഞ്ചിന്‍ തെരഞ്ഞെടുക്കുക

    ടിടിഎസ് ഡാഷ്ബോര്‍ഡ് എഞ്ചിന്‍ പട്ടികയില്‍ നിന്നും ഡയറിയ തെരഞ്ഞെടുക്കുന്നു. ഡിയാ, പല- സ്പോക്കര്‍, ശബ്ദസഞ്ചയമുള്ള, വിരൂപമായ മാതൃകയാണ്.

  3. 3

    ടാഗുകള്‍ക്കൊപ്പം ഡയലോഗ് സ്ക്രിപ്റ്റ് എഴുതുക

    ഓരോ പ്രസംഗക്കാരനും തിരിഞ്ഞുനോക്കാനായി [S2] സംഭാഷണം തയ്യാറാക്കുക.

  4. 4

    ശബ്ദമുണ്ടാക്കുക

    നിങ്ങളുടെ Dia സ്ക്രിപ്റ്റ് നിര്‍മ്മാണത്തില്‍ നിര്‍മ്മാണകര്‍ GPUS. Dia Dia രണ്ടു് ഇഞ്ചര്‍ ഡയലോഗ് വിന്യസിക്കുന്നു. നിങ്ങളുടെ കണ്‍സ്ട്രക്ടര്‍ അല്ലെങ്കില്‍ നിങ്ങളുടെ മാന്‍ബാള്‍ ടാഗുകള്‍ ഒറ്റ ഓഡിയോ ഫയലിലേക്ക് അയയ്ക്കുന്നു.

  5. 5

    ഡൌണ്‍ലോട് ചെയ്യുക അല്ലെങ്കില്‍ API നെ വിളിക്കുക

    നിങ്ങളുടെ തെരഞ്ഞെടുത്ത രീതിയില്‍ നിര്‍ത്തിയ ഡയലോഗ് ഡൌണ്‍ലോഡ് ചെയ്യുക, അല്ലെങ്കില്‍ അതേ [S1]/ [S2] സ്ക്രിപ്റ്റ് TextToSpeechAIAPI ആവര്‍ത്തിയായി നല്‍കുക.

ഡിയ എപിഐ

TextToSpeechAI റെസ്റ്റ് API ഉപയോഗിച്ച് വളരെ ലളിതമായി പ്രസംഗ പരിപാടി ഉണ്ടാക്കുക.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[എസ്1] ഹലോ, ഇന്ന് നിങ്ങള്‍ എങ്ങനെയുണ്ട്?",
    "voice": "en_US-lessac-medium"
  }'

പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ

Dia ഒരു 1.6B പരാമീറ്റര്‍ ഡയലോഗാണു് നരി ലാബ്സിലുള്ള ലേഖന- നിര്‍ദ്ദേശിക്കല്‍ മാതൃക. ഒന്നിലധികം സംസാരക്കാര്‍ക്കും, നാവികതയില്ലാത്ത ശബ്ദങ്ങള്‍ക്കും പിന്തുണയോടെ സ്വാഭാവികമായ സംഭാഷണം സജ്ജീകരിക്കുന്നു.

അതെ, ഡിയ പൂര്‍ണ്ണമായും അച്ചന്‍ 2.0 ലൈസന്‍സ് - മാതൃകാ തൂക്കവും മാതൃകാ തൂക്കവും ആണ്. ഇത് വാണിജ്യ പ്രയോഗങ്ങളില്‍ സ്വതന്ത്രമായി ഉപയോഗിക്കാം.

നിലവിലുള്ള ഡയറക്ടറി ഇംഗ്ലീഷ് മാത്രം പിന്തുണയ്ക്കുന്നു. മാതൃക സാധാരണ ഇംഗ്ലീഷ് സംസാരത്തിനു് അനുയോജ്യമാക്കും.

Diaയ്ക്ക് VRAB-യുടെ ഏകദേശം 10GB-യുടെ 160B യുടെ ഗുണമേന്മയുടെ ആവശ്യമുണ്ട്. കുറഞ്ഞത് 12GB ഉള്ള GPU യില്‍ ആശ്ചീനമായ പ്രവര്‍ത്തനം നടത്താന്‍ ശുപാര്‍ശ ചെയ്യുന്നു. TextToSpeechAIല്‍ ഇതെല്ലാം ഞങ്ങളുടെ ഹോസ്റ്റര്‍ GPUS- ല്‍ പ്രവര്‍ത്തിക്കുന്നു, അതുകൊണ്ട് നിങ്ങളുടെ സ്വന്തം ഹാര്‍ഡര്‍ ആവശ്യമില്ല.

- അതെ, ഡിയ നിര്‍മ്മിച്ചതാണു്. ഡിയ ടി. ടി. ടി. ടി. ടി. സ്ക്രിപ്റ്റ് ഉപയോഗിച്ച്, പല ശബ്ദങ്ങളോടും സാങ്കേതികമായി സംഭാഷണം നടത്തുന്നു. അത് ഒറ്റ ഫോക്റ്റര്‍ ടി. ടി. ടി. ടി. ടി. സ്പെല്ലിന്റെ മാതൃകകളുമായി ഒത്തുപോകുന്നു.

ഓരോ സ്ക്രിപ്റ്റിനും [S2] / അടയാളമിടാനുള്ള ഓരോ വരിയും മുന്‍ഗണന നല്‍കുക. ഡയിയ ഓരോ ടാഗിലും ഒരേ ശബ്ദവും നല്‍കുന്നു, സംഭാഷണം നീങ്ങുന്ന പോലെ അവ തമ്മില്‍ മാറ്റുന്നു, [S2] [എസ്2]] [എസ്2]] നിങ്ങളുടെ സംഭാഷണത്തിലെ രണ്ട് അക്ഷരങ്ങളെപ്പോലെ പ്രവര്‍ത്തിപ്പിക്കുക.

അതെ, ഡിജിറ്റല്‍ 5- 10 സെക്കന്‍റില്‍ നിന്നും ശബ്ദവിഡംബനം തുടരുന്നു, സംസാരകനായൊരു പ്രത്യേക ശബ്ദമാണു് നിങ്ങള്‍ വീണ്ടും ഉപയോഗിക്കാന്‍ അനുവദിക്കുന്നു. നിങ്ങള്‍ക്കു് ക്വിനുമായി [S1/ 2] [S2] മായി ചേര്‍ക്കാന്‍ കഴിയും അതുകൊണ്ട് ഓരോ ക്ളൈനിലും ഓരോ ക്യാബറിലും നിങ്ങള്‍ ക്ലോക്ക് ചെയ്ത ശബ്ദം പോലെ ശബ്ദമുടക്കാവുന്ന ശബ്ദങ്ങള്‍.

Dia [ച്‌പുകകള്‍, [ചുറ്റല്‍, [ചുറ്റല്‍സ്], വാക്കുകള്‍ക്ക് പകരം സ്വാഭാവികമായി ശബ്ദങ്ങള്‍ പോലെയാണ്. ഒരു ടാഗ് നല്‍കുക. ഉദാഹരണത്തിന് - "അതു പല്‍ക്കു [സ്പര്‍ച്" (ഹൈലികള്‍) എന്നൊരു ടാഗുകള്‍ (ഹൈല്‍സ്"), കൂടുതല്‍ മനുഷ്യനുമായി അനുഭവിപ്പിക്കാന്‍ വേണ്ടി.

ഡയിയും ബാര്‍ക്ക്‌ വാര്‍ത്തയില്ലാത്ത ശബ്ദങ്ങള്‍ പിന്തുണയ്ക്കുന്നു. പക്ഷേ, ഡിയ ഡിസൈനുകള്‍ ഒന്നിലധികം സ്പീഷീസുകള്‍ക്കു് വേണ്ടിയുള്ള സംഭാഷണങ്ങള്‍ക്കു് നിര്‍മ്മിച്ചിട്ടുള്ളതാണ്. [S1] അല്ലെങ്കില്‍ ശബ്ദചലനവും ശബ്ദവിവരവും നല്‍കുന്നതിനായി. കൃതിയും ഡീയ തെരഞ്ഞെടുക്കുക. പരമ്പരാസങ്കലമായ രണ്ട് സംഭാഷണങ്ങളും സ്വഭാവങ്ങളും. ഒരേ ബീക്ക് വര്‍ത്തമാനത്തില്‍ കൂടുതല്‍ വര്‍ദ്ധിപ്പിക്കേണ്ടി വരുമ്പോള്‍ ബാര്‍ക്ക് കൂടുതല്‍ ഉചിതമാണ്.

Dia ഒരു അതികഠിന-ടൈറ്ററി എഞ്ചിന്, അതുകൊണ്ട്, ഇത് പ്രവര്‍ത്തനക്ഷമമായ 1,000 അക്ഷരങ്ങള്‍ക്ക് 50 അളവിനു വില നല്‍കുന്നു. ഡ്രസ് സ്ട്രെയര്‍ വലിയ 1.2ബി മോഡും ജിപിഐ ഓര്‍മ്മകളുടെ 'ഐപിബി' ബാറ്ററിനും അത് ഉപയോഗിക്കുന്നു.

അതെ. പുതിയ TextToSpeechAI അക്കൌണ്ടുകള്‍ സ്വതന്ത്രമായ ഗ്റാസ്റ്റര്‍ ലോറികള്‍ ഉള്‍പ്പെടുത്തുന്നു, നിങ്ങള്‍ക്ക് ഒപ്പ് വെക്കാതെ പ്രവര്‍ത്തിക്കാം. അത് കുറഞ്ഞ ഡയറിയ ഡയലോഗ് ഉണ്ടാക്കാന്‍ മാത്രം മതി. ഒരു പേപ്പര്‍ പ്ലാന്‍ നിര്‍ദ്ദേശിക്കുന്നതിനു മുന്‍പ്.

നിങ്ങളുടെ അക്കൗണ്ട് താളില്‍ നിന്നും API അടയാളം കിട്ടിയാല്‍ ഡയറി ഡയലോഗ് സ്ക്രിപ്റ്റുകള്‍ സമര്‍പ്പിക്കാം - [S2] [ചോദനങ്ങള്‍ ഉള്‍പ്പെടുത്തുന്ന മോതിരങ്ങളും ടാഗുകളും - [ചോദനങ്ങള്‍ പോലുള്ള TextToSpeechAI ARV AAT ല്‍ (ചുവപ്പ്) വരെ - ഫലം ലഭ്യമാക്കുന്ന ഓഡിയോപ്രോജകങ്ങള്‍ ഡൌണ്‍ലോഡ് ചെയ്യുക.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try ഡിയ Now

Generate your first audio free. No credit card required.

Start Free