ഡിയ
Ultraശബ്ദ ശബ്ദവും ശൂന്യമായ ശബ്ദവും ഉപയോഗിച്ചു് ഡയലോഗ്- ഇന്ററാക്റ്റീവ് ടിടിഎസ്
സംബന്ധിച്ച് ഡിയ
Dia നൈ ലാബ്സ് വിന് 160B പരാമീറ്റര് സജീവമായ ഒരു ഡയലോഗ്- ഫോക്കസ്-ഫോള്ഡര്- മോഡാണ്. ഇത് പ്രകൃതിയിലുള്ള സംഭാഷണം നന്നായി പ്രയോജനപ്രദമാകുന്നു. ചിരി, നെടുവീര്പ്പില്ലാത്ത ശബ്ദങ്ങള്, നെഞ്ചുകള്, ഇനങ്ങള് എന്നിവയ്ക്കു് വേണ്ടിയുള്ള പിന്തുണയോടെ. ഡിവിഡി 5- 10 സെക്കന്ഡുകളില് നിന്നുള്ള ഒന്നില് നിന്നും ശബ്ദവിവരക്കണക്കുകള്ക്കും ശബ്ദങ്ങള്ക്കും ക്രിയകള്ക്കും വേണ്ടി പിന്തുണക്കുന്നു. ഇതു് ക്രിയകള്ക്കു് അനുയോജിക്കുന്നു.
കീ വിശേഷതകള്
ഡയലോഗ് പരമ്പര
സ്വാഭാവികമായ ഒന്നിലധികം ശബ്ദങ്ങള് തമ്മില് വര്ണ്ണിപ്പിക്കുക, ശബ്ദങ്ങള് കേള്ക്കുക.
ശബ്ദങ്ങള്
[ചിഹ്നങ്ങള്, [ചിലര, പിണ്ഡങ്ങള്, സ്വാഭാവികമായ ഭാവങ്ങള്ക്ക് (gaps) കൂട്ടിച്ചേര്ക്കുക.
ശബ്ദം ക്ലോണ്
സ്വകാര്യ സംസാരത്തിനുള്ള റെക്കോര്ഡ് ഓഡിയോയില് നിന്ന് 5-10 സെക്കന്റുകളില് നിന്ന് ശബ്ദം ക്ലിക്ക് ചെയ്യുക.
പ്രകൃതിയുടെ വര്ത്തമാനം
160ബി പരാമീറ്റർ പ്രകൃതം സംപ്രേക്ഷണവും സ്ഥായവും ഉത്ഭവിപ്പിക്കുന്നു.
കേസുകള് ഉപയോഗിക്കുക
എങ്ങനെ ഉപയോഗിക്കണം? ഡിയ
-
1
ഫ്രീ ആയിക്കോ, അല്ലെങ്കില് ഡീമോ തുറക്ക്.
നിങ്ങളുടെ തുടക്കക്കാരന്റെ ക്രെഡിറ്റ് എന്ന് അവകാശപ്പെടാന് TextToSpeechAI അക്കൌണ്ട് ഉണ്ടാക്കൂ അല്ലെങ്കില് ഡിയ ഡയലോഗ് പരിശോധിക്കാന് ഒരു സിഗ്നപ്പ് ഡിമോ തുറക്കൂ.
-
2
Dia എഞ്ചിന് തെരഞ്ഞെടുക്കുക
ടിടിഎസ് ഡാഷ്ബോര്ഡ് എഞ്ചിന് പട്ടികയില് നിന്നും ഡയറിയ തെരഞ്ഞെടുക്കുന്നു. ഡിയാ, പല- സ്പോക്കര്, ശബ്ദസഞ്ചയമുള്ള, വിരൂപമായ മാതൃകയാണ്.
-
3
ടാഗുകള്ക്കൊപ്പം ഡയലോഗ് സ്ക്രിപ്റ്റ് എഴുതുക
ഓരോ പ്രസംഗക്കാരനും തിരിഞ്ഞുനോക്കാനായി [S2] സംഭാഷണം തയ്യാറാക്കുക.
-
4
ശബ്ദമുണ്ടാക്കുക
നിങ്ങളുടെ Dia സ്ക്രിപ്റ്റ് നിര്മ്മാണത്തില് നിര്മ്മാണകര് GPUS. Dia Dia രണ്ടു് ഇഞ്ചര് ഡയലോഗ് വിന്യസിക്കുന്നു. നിങ്ങളുടെ കണ്സ്ട്രക്ടര് അല്ലെങ്കില് നിങ്ങളുടെ മാന്ബാള് ടാഗുകള് ഒറ്റ ഓഡിയോ ഫയലിലേക്ക് അയയ്ക്കുന്നു.
-
5
ഡൌണ്ലോട് ചെയ്യുക അല്ലെങ്കില് API നെ വിളിക്കുക
നിങ്ങളുടെ തെരഞ്ഞെടുത്ത രീതിയില് നിര്ത്തിയ ഡയലോഗ് ഡൌണ്ലോഡ് ചെയ്യുക, അല്ലെങ്കില് അതേ [S1]/ [S2] സ്ക്രിപ്റ്റ് TextToSpeechAIAPI ആവര്ത്തിയായി നല്കുക.
ഡിയ എപിഐ
TextToSpeechAI റെസ്റ്റ് API ഉപയോഗിച്ച് വളരെ ലളിതമായി പ്രസംഗ പരിപാടി ഉണ്ടാക്കുക.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[എസ്1] ഹലോ, ഇന്ന് നിങ്ങള് എങ്ങനെയുണ്ട്?",
"voice": "en_US-lessac-medium"
}'
പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50