স্টাইল TTS ২
Ultraস্টাইল ট্রান্সফার সহ মানব-স্তরের টেক্সট-টু-স্পিকার
পরিচিতি স্টাইল TTS ২
s. It is the first TTS system to use the
প্রধান বৈশিষ্ট্য
মানব-স্তরের গুণমান
অন্ধ পরীক্ষায় মানুষের রেকর্ড থেকে আলাদা করা যায় না এমন কথাবার্তা তৈরি করে।
স্টাইল স্থানান্তর
যেকোন রেফারেন্স অডিও নমুনা থেকে কথা বলার শৈলী স্থানান্তর করুন।
প্রাকৃতিক শব্দভাণ্ডার
ডিফোশন ভিত্তিক মডেলিং এর সাথে পূর্ণাঙ্গ রীতি, চাপ এবং তাল।
শব্দ ক্লোনিং
অসাধারণ সঠিকতা এবং প্রাকৃতিকতার সাথে কণ্ঠস্বর ক্লোন করুন।
দ্রুত অনুমান
স্বয়ংক্রিয়ভাবে হ্রাসশীল মডেলের চেয়ে দ্রুততর, কিন্তু গুণগতমান বজায় রাখা যায়।
ওপেন সোর্স
এমআইটি লাইসেন্সকৃত, সম্পূর্ণ বাণিজ্যিক ব্যবহারের অধিকার সহ।
ব্যবহারের ক্ষেত্রে
স্টাইল TTS ২ Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENব্যবহারের নিয়ম স্টাইল TTS ২
-
1
বিনামূল্যে নিবন্ধন করুন অথবা ডেমো চালান
Create a free TextToSpeechAI account to get starter credits, or use the homepage demo to hear StyleTTS2 without signing in.
-
2
StyleTTS2 ইঞ্জিন বেছে নিন
শব্দ লাইব্রেরী থেকে একটি StyleTTS2 শব্দ নির্বাচন করুন। একটি শব্দ ক্লোন করতে, একটি ১০-৩০ সেকেন্ডের রেফারেন্স ক্লিপ আপলোড করুন এবং StyleTTS2 এর শব্দের ধরন স্থানান্তর করবে।
-
3
আপনার লেখা লিখুন
আপনি যে স্ক্রিপ্টটি বর্ণনা করতে চান তা টাইপ অথবা পেস্ট করুন । StyleTTS2 ইংরেজি ভাষায় অসাধারণ এবং দীর্ঘ অংশে প্রাকৃতিকভাবে শব্দের বিন্যাস, জোর এবং উচ্চারণ প্রদান করে ।
-
4
অডিও তৈরি করুন
ক্লিক করুন তৈরি করুন এবং TextToSpeechAI আপনার StyleTTS2 অডিও GPU এ রেন্ডার করবে। অতিরিক্ত স্তরের StyleTTS2 এর মূল্য প্রতি ১০০০ অক্ষর ৫০ ক্রেডিট।
-
5
API ডাউনলোড অথবা ব্যবহার করুন
StyleTTS2 অডিও MP3, WAV, অথবা OGG হিসাবে ডাউনলোড করুন, অথবা স্বয়ংক্রিয়ভাবে উত্পাদন করতে আপনার StyleTTS2 শব্দের সাথে TextToSpeechAI API কল করুন।
স্টাইল TTS ২ অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)
TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "স্টাইলটিটিএস ২ এমনভাবে স্বাভাবিকভাবে কথা বলে যে, এটি পেশাদার মানুষের রেকর্ডিংয়ের সাথে প্রতিদ্বন্দ্বিতা করে।",
"voice": "styletts2-default"
}'
প্রায়শই জিজ্ঞাসিত প্রশ্ন
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50