मेलोTTS

Standard

नैसर्गिक प्रोसोडी सह जलद बहु- उच्चारण TTSName

Very Fast वेग
Good गुणवत्ता
नाही क्लोन
6 भाषाName

विषयी मेलोTTS

[Translation temporarily unavailable. Please try again.]

मुख्य वैशिष्ट्ये

बहु- उच्चारण

अनेक इंग्रजी उच्चार: अमेरिकन, ब्रिटिश, भारतीय आणि ऑस्ट्रेलियन.

CPU रियल- टाइम

याचा अर्थ असा की, जीपीएसच्या मदतीने निरीक्षण करता येत नाही.

भाषाName

इंग्रजी, स्पॅनिश, फ्रेंच, चिनी, जपानी व कोरियाई भाषांना समर्थन पुरवते.

वेग नियंत्रण

यासाठी द्रुतगती मार्गाचा वापर केला जातो.

वापरा प्रकरणे

बहु- उच्चारण आवाज अनुप्रयोगName आंतरराष्ट्रीय विषयवस्तु स्थानिकीकरण वास्तविक वेळ आवाज सहाय्यकName ऑडिओबुक निर्मिती, उच्चार विविधतेसह

वापर कसे कराल मेलोTTS

  1. 1

    मोफत नोंदणी करा किंवा डेमोचा वापर करा

    TextToSpeechAI मोफत खाते तयार करा, स्टार्टअप क्रेडिट मिळविण्यासाठी, किंवा MeloTTS त्वरित चाचणी करण्यासाठी मुख्य पानावर नोंदणी न करता डेमोचा वापर करा. मोफत क्रेडिट तुम्ही commit करण्यापूर्वी अनेक MeloTTS उच्चारांचे मूल्यांकन करण्यासाठी पुरेसे आहे.

  2. 2

    MeloTTS उच्चारण व आवाज निवडा

    आवाज ब्राउजर उघडा व MeloTTS करीता फिल्टर करा. अमेरिकन, ब्रिटिश, भारतीय किंवा ऑस्ट्रेलियन इंग्रजी किंवा मूळ स्पॅनिश, फ्रेंच, चिनी, जपानी किंवा कोरियाई आवाज यांसारखे तुमच्या श्रोत्यांशी जुळणारे उच्चार निवडा.

  3. 3

    पाठ्य प्रविष्ट करा

    पाठ्य पेटी अंतर्गत तुम्हाला आवाज द्यायची स्क्रिप्ट टाइप करा किंवा चिकटवा. MeloTTS नैसर्गिक प्रोसोडी आपोआप हाताळते, व तुम्ही निवडलेल्या उच्चार करीता गती सुधारणा करीता बोलण्याजोगी वेग समायोजित करू शकता.

  4. 4

    ऑडिओ बनवा

    निर्मिती करीता क्लिक करा व MeloTTS तुमचे भाषण वास्तविक वेळेत संश्लेषित करते. कारण ते CPU वर कार्यक्षमरित्या चालते, परिणाम लांब वाक्यांकरीताही लवकर परत येतो, व काम 1000 अक्षरांकरीता 10 क्रेडिट लागते.

  5. 5

    API डाउनलोड करा किंवा वापरा

    परिणाम पुन्हा चालवा, त्यानंतर इतिहास पानातून तुमच्या पसंतीच्या स्वरूपात ऑडिओ फाइल डाउनलोड करा. आपल्या स्वतःच्या अनुप्रयोगात MeloTTS स्वचालित करण्यासाठी, api.texttospeechai.com वरील TextToSpeechAI REST API ला कॉल करा तुमच्या खात्यामधील API टोकन वापरून.

मेलोTTS API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ॲरिस्टॉटलच्या मते, जगातील सर्व गोष्टींचे मूळ हे तत्त्वज्ञानात आहे.",
    "voice": "en_US-lessac-medium"
  }'

वारंवार विचारले जाणारे प्रश्न

MeloTTS हे MyShell AI पासून एक जलद पाठ्य- ते- वक्तव्य मॉडेल आहे जे बहु- उच्चार वक्तव्य संश्लेषण करीता विशेष आहे. ते अनेक भाषांना समर्थन देते ज्यात इंग्रजीसाठी अनेक उच्चार बदल आहेत, वास्तविक वेळ गतीने नैसर्गिक प्रोसोडी तयार करते.

होय. MeloTTS MIT परवाना अंतर्गत प्रकाशित केले गेले आहे, दोन्ही कोड व मॉडेल वजन समाविष्टीत आहे. तुम्ही त्याचे मुक्तपणे व्यावसायिक उत्पादनात वापर करू शकता, royalties किंवा attribution आवश्यकता नसून.

MeloTTS अमेरिकन, ब्रिटिश, भारतीय व ऑस्ट्रेलियन इंग्रजी उच्चार करीता समर्थन पुरवते. यामध्ये स्पॅनिश, फ्रेंच, चिनी, जपानी व कोरियाई करीता मूळ आवाज समाविष्टीत आहे, आंतरराष्ट्रीय अनुप्रयोग करीता योग्य बनविते.

MeloTTS सहा भाषांचा समावेश करतो: इंग्रजी, स्पॅनिश, फ्रेंच, चिनी, जपानी व कोरियाई. इंग्रजी आवाज आधार भाषा वरील प्रामाणिक क्षेत्रीय उच्चार जोडतात, म्हणून एकच मॉडेल अनेक बाजारपेठ हाताळते.

होय. MeloTTS वास्तविक वेळ संश्लेषण करीता बनविले गेले आहे व CPU वरही प्लेबॅक पेक्षा जलद भाषण निर्माण करते. हे लाइव आवाज सहाय्यक, चॅटबॉट, व स्ट्रीमिंग अनुप्रयोग करीता मजबूत बनविले आहे.

MeloTTS चांगले, नैसर्गिक आवाजाचे भाषण तयार करते, स्पष्ट शब्दरचना व अचूक उच्चार बरोबर. गती व उच्चार विविधता गतीने गतीने StyleTTS2 किंवा Tortoise सारख्या उच्च दर्जाच्या विश्वासार्हतेपेक्षा प्राधान्यतेने प्राधान्यतेने, म्हणून प्रतिसाद सर्वात महत्वाचे आहे जेव्हा ते आदर्श आहे.

नाही, MeloTTS आवाज क्लोन करत नाही. ते पूर्वनिर्धारित स्पीकर व उच्चारांचे निश्चित समुह वापरते. TextToSpeechAI वर आवाज क्लोन करीता, F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2 किंवा Tortoise चा वापर करा.

GPU ची गरज नाही. MeloTTS CPU वर सुमारे 500MB स्मृती वापरून सहज चालते व वास्तविक वेळेत राहते. GPU वैकल्पिक आहे व फक्त अतिरिक्त वेग जोडतो; जर तुम्ही एक वापरायचे ठरवले तर सुमारे 500MB VRAM पुरेसे आहे.

मेलोटीटीएस हे TextToSpeechAI वरील मानक-स्तर इंजिन आहे, दर 1,000 अक्षरांसाठी 10 क्रेडिटची बिल आहे. हे सर्वात कमी किंमतीचे स्तर आहे, Piper, VITS, आणि Kokoro सारख्या इतर हलक्या CPU मॉडेलशी जुळते.

MeloTTS व Kokoro हे दोन्ही वेगवान, मानक क्रेडिट स्तरावर MIT/Apache-लाइसेन्स CPU मॉडेल आहेत. तुम्हाला वेगळे इंग्रजी उच्चार (अमेरिकन, ब्रिटिश, भारतीय, ऑस्ट्रेलियन) हवे असल्यास MeloTTS निवडा; त्याच्या बहुभाषिक आवाजाच्या विविधतेसाठी Kokoro निवडा. दोन्ही TextToSpeechAI वर A/B चाचणी करणे सोपे आहे.

MeloTTS उच्चार विविधता व बहुभाषिक कव्हरेज मध्ये उत्कृष्ट आहे, तर Piper सर्वात मोठी पूर्वनिर्धारित आवाज लायब्ररी प्रदान करते. दोन्ही वेगवान व मानक स्तरावर CPU- सामर्थ्यवान आहेत, म्हणून उच्चार- विशिष्ट प्रकल्पांसाठी MeloTTS निवडा आणि Piper जेव्हा तुम्हाला वेगळ्या आवाजांचे सर्वात मोठे निवडायचे असेल.

होय. नविन TextToSpeechAI खात्यांमध्ये मोफत प्रारंभिक क्रेडिट समाविष्टीत आहे, आणि येथे एक डेमो आहे जे तुम्ही नोंदणी न करता वापरू शकता. अतिरिक्त क्रेडिट खरेदी करण्यापूर्वी किंवा सब्सक्रिप्शन करण्यापूर्वी MeloTTS उच्चार व आवाज चाचणी करण्यासाठी ते पुरेसे आहे.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try मेलोTTS Now

Generate your first audio free. No credit card required.

Start Free