ওপেনভয়েসName

Ultra

গ্রানুলার টোন নিয়ন্ত্রণ সহ অবিলম্বে ভয়েস ক্লোনিং

Moderate গতি
Very Good গুণমান
হ্যাঁ ক্লোনিং
10 ভাষা

পরিচিতি ওপেনভয়েসName

of the voice and apply it to the speaking style. OpenVoice is an instant voice cloning model that allows fine-grained control over speaking style, allowing you to takealook at the voice and apply it to the speaking style. OpenVoice is an instant voice cloning model that allows fine-grained control over speaking style, allowing you to takealook at the

প্রধান বৈশিষ্ট্য

অবিলম্বে ক্লোন করা হচ্ছে

অডিও থেকে কয়েক সেকেন্ডের মধ্যে যে কোন শব্দ ক্লোন করুন।

টোন নিয়ন্ত্রণ

আনন্দ, দুঃখ, রেগে, উত্তেজিত, অথবা চুপচাপ টোন প্রয়োগ করুন।

স্টাইল ট্রান্সফার

নমনীয়তার জন্য কথা বলার ধরন থেকে শব্দ পরিচয় আলাদা করুন।

ক্রস- লিঙ্গুয়াল

বিভিন্ন ভাষার মধ্যে ক্লোন করা শব্দ ব্যবহার করুন।

দ্রুত প্রসেসিং

দ্রুত শব্দ উৎপাদনের জন্য কার্যকর অনুমান।

ওপেন সোর্স

বাণিজ্যিক ব্যবহারের জন্য এম.আই.টি. লাইসেন্সপ্রাপ্ত।

ব্যবহারের ক্ষেত্রে

আবেগপ্রবণ বিষয়বস্তু অক্ষর অ্যানিমেশন মিথস্ক্রিয় খেলা অডিওবইয়ের বর্ণনা মার্কেটিং ভিডিও ভার্চুয়াল সহকারী

ব্যবহারের নিয়ম ওপেনভয়েসName

  1. 1

    বিনামূল্যে নিবন্ধন করুন অথবা ডেমো চেষ্টা করুন

    Create a free TextToSpeechAI account to get starter credits, or use the on-page demo to hear OpenVoice before committing. No local GPU or install is needed - everything runs on our servers.

  2. 2

    OpenVoice নির্বাচন করুন এবং একটি রেফারেন্স ক্লিপ আপলোড করুন

    OpenVoice ইঞ্জিন নির্বাচন করুন, তারপর কিছু সেকেন্ডের পরিষ্কার রেফারেন্স অডিও আপলোড করুন যাতে লক্ষ্য অডিওটি ক্লোন করা যায়। OpenVoice স্পিকারের পরিচয় ধারণ করে যাতে আপনি যেকোনো টেক্সট এবং টোন ব্যবহার করে তা পুনরায় ব্যবহার করতে পারেন।

  3. 3

    আপনার লেখা লিখুন

    ক্লোন করা কণ্ঠে আপনি যে স্ক্রিপ্টটি বলতে চান তা টাইপ করুন অথবা সাঁটান। OpenVoice প্রায় ১০টি ভাষা এবং ক্রস-লিঙ্গুইজ ডেলিভারি সমর্থন করে, তাই আপনি রেফারেন্স ক্লিপের চেয়ে ভিন্ন ভাষায় লিখতে পারেন।

  4. 4

    একটি টোন শৈলী বেছে নিন এবং তৈরি করুন

    নয়টি OpenVoice টোন স্টাইলের মধ্যে একটি নির্বাচন করুন - ডিফল্ট, বন্ধুত্বপূর্ণ, উচ্ছ্বসিত, উত্তেজিত, দুঃখী, রেগে, ভীত, চিৎকার করা, অথবা চুপচাপ - তারপর উত্পাদন করুন। একই ক্লোন করা কণ্ঠস্বর সেই আবেগপূর্ণ পরিবেশন সহ কথা বলবে।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    আপনার অডিও MP3, WAV, অথবা OGG হিসাবে ডাউনলোড করুন, অথবা প্রতিটি অনুরোধের মধ্যে আপনার ক্লোন করা কন্ঠ এবং টোন স্টাইল প্রদান করে TextToSpeechAI API এর মাধ্যমে স্বয়ংক্রিয়ভাবে উত্পাদন করুন।

ওপেনভয়েসName অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ওপেনভয়েস যে কোন ধরনের শব্দ ব্যবহার করতে পারে \u002D আনন্দ, দুঃখ, এমনকি চুপচাপ কথা বলাও।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

ওপেনভয়েস একটি উন্নত টেক্সট-টু-স্পীচ এবং ভয়েস ক্লোনিং মডেল যা কথা বলার ধরন থেকে ভয়েস পরিচয়কে আলাদা করে। এটি আপনাকে একটি ভয়েস ক্লোন করতে এবং তারপর প্রতিটি আবেগ জন্য নতুন রেফারেন্স অডিও প্রয়োজন ছাড়া বিভিন্ন আবেগপূর্ণ টোন প্রয়োগ করতে দেয়। এটি প্রকাশ্য, নিয়ন্ত্রিত ভয়েস উৎপাদনের জন্য নির্মিত।

হ্যাঁ, OpenVoice অডিও রেফারেন্সের কয়েক সেকেন্ডের মধ্যেই অবিলম্বে শব্দ ক্লোন করে - কোন প্রশিক্ষণ প্রয়োজন হয় না। একটি শব্দ ধারণ করা হলে OpenVoice যে কোন টেক্সট এবং যে কোন টোন স্টাইলের মধ্যে সেই পরিচয় পুনরায় ব্যবহার করতে পারে যা আপনি বেছে নেন।

ওপেনভয়েস একটি দুই-ধাপের স্থাপত্য ব্যবহার করে যা টোন রূপান্তর থেকে মৌলিক কথা বলা সংশ্লেষণকে বিভক্ত করে। একটি কণ্ঠস্বর ক্লোন করার পরে, আপনি ৯টি টোন স্টাইলের যে কোন একটি প্রয়োগ করতে পারেন - ডিফল্ট, বন্ধুত্বপূর্ণ, উচ্ছ্বসিত, উত্তেজিত, দুঃখী, রেগে, ভীত, চিৎকার করা, অথবা চুপচাপ - এবং একই ক্লোন করা কণ্ঠস্বর আপনার নির্বাচিত টোনের উপর ভিত্তি করে পুনরায় রেকর্ড না করে ভিন্নভাবে কথা বলে।

ওপেনভয়েস নয়টি কথা বলার ধরন সমর্থন করে: ডিফল্ট, বন্ধুত্বপূর্ণ, উচ্ছ্বসিত, উত্তেজিত, দুঃখী, রেগে যাওয়া, ভয় পেয়ে যাওয়া, চিৎকার করা এবং চুপচাপ। প্রতিটি ধরন ক্লোন করা বক্তার পরিচয় সংরক্ষণের সময় আবেগপূর্ণ বিতরণকে পুনর্বিন্যাস করে, আপনাকে একটি লাইন পড়া সম্পর্কে সুনির্দিষ্ট নিয়ন্ত্রণ প্রদান করে।

ওপেনভয়েস MIT লাইসেন্সের অধীনে মুক্ত উৎস, তাই এটি বাণিজ্যিক ব্যবহারের জন্য বিনামূল্যে। যেকোন ক্লোন মডেলের মতো, আপনি যেকোন বাণিজ্যিক প্রকল্পের জন্য ক্লোন করা যেকোন শব্দের জন্য আপনার যথাযথ অধিকার আছে তা নিশ্চিত করুন।

ওপেনভয়েস ইংরেজি, চীনা, জাপানি, কোরিয়ান এবং বেশ কয়েকটি ইউরোপীয় ভাষা সহ প্রায় ১০টি ভাষা সমর্থন করে। এটি ক্রস-লিঙ্গুইস্টিক ক্লোনিংও প্রদান করে, যাতে আপনি একটি ভাষার একটি কণ্ঠস্বর ক্লোন করে অন্য ভাষায় স্বাভাবিকভাবে কথা বলতে পারেন।

ওপেনভয়েস-এর প্রজনন গতি মাঝারি, সাধারণত একটি বাক্যের জন্য ২-৪ সেকেন্ড সময় লাগে। আউটপুট গুণমান খুবই ভালো, স্পষ্টভাবে শব্দ পুনঃপ্রতিষ্ঠা এবং টোন ট্রান্সফার যা স্পিকারের পরিচয় অক্ষত রাখে এবং একই সাথে বিশ্বাসযোগ্যভাবে আবেগগত পরিবেশন পরিবর্তন করে।

OpenVoice typically requires 6-8GB of VRAM depending on batch size and tone conversion load. It runs comfortably on mid-range to upper mid-range GPUs, and on TextToSpeechAI all of this is handled on our servers so you do not need any local hardware.

ওপেনভয়েস একটি আল্ট্রা-টিয়ার ইঞ্জিন, যার মূল্য ১০০০ অক্ষরের জন্য ৫০ ক্রেডিট। আল্ট্রা-টিয়ার এর উন্নত টোন নিয়ন্ত্রণ এবং ক্লোনিং এবং স্টাইল-পরিবর্তন পাইপলাইনের জন্য অতিরিক্ত কম্পিউটিং প্রয়োজনীয়তা প্রতিফলিত করে।

ওপেনভয়েস এর টোন এবং স্টাইল নিয়ন্ত্রণের জন্য অনন্য: আপনি একটি ক্লোন করা কণ্ঠ নিয়ে তা আনন্দিত, দুঃখিত, রেগে যাওয়া, অথবা চুপচাপ বলে পুনরায় প্রদান করতে পারেন। F5- TTS দ্রুততর এবং আমাদের ডিফল্ট ক্লোন ইঞ্জিন প্রাকৃতিক, নিরপেক্ষ কথার জন্য। আবেগপূর্ণ স্টাইল নিয়ন্ত্রণের প্রয়োজনে ওপেনভয়েস বেছে নিন, এবং F5- TTS দ্রুততম প্রাকৃতিক ক্লোন চান।

রেফারেন্স অডিও আপলোড করে একটি ক্লোন করা কন্ঠ তৈরি করুন, তারপর আপনার API অনুরোধের মধ্যে একটি টোন শৈলী উল্লেখ করুন। API স্বয়ংক্রিয়ভাবে আপনার নির্বাচিত আবেগপূর্ণ টোনটি ক্লোন করা কন্ঠে প্রয়োগ করে এবং MP3, WAV, অথবা OGG ফরম্যাটে অডিও ফিরিয়ে দেয়।

Yes. Sign up for a free TextToSpeechAI account to receive starter credits and try OpenVoice cloning and tone control, or use the on-page demo first. There is no local setup - upload a reference clip, pick a tone, and generate in the browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try ওপেনভয়েসName Now

Generate your first audio free. No credit card required.

Start Free