পাতলা

Premium

আবেগ এবং শব্দের প্রভাব সহ প্রকাশমূলক AI বক্তৃতা

Slow গতি
Very Good গুণমান
না ক্লোনিং
13 ভাষা

পরিচিতি পাতলা

s of speech that are not heard by humans. Bark is an open source, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit, non-profit

প্রধান বৈশিষ্ট্য

আবেগপ্রবণ অভিব্যক্তি

হাসি, চিৎকার, শ্বাসকষ্ট এবং সত্যিকারের অনুভূতির সাথে কথা বলুন।

ইমোট- মার্কার

[হাসি], [শ্বাসকষ্ট], জোর দেবার জন্য ক্যাপস ব্যবহার করুন, এবং... দ্বিধা করার জন্য।

বহুভাষিক

প্রাকৃতিক উচ্চারণ এবং উচ্চারণ সহ ১৩+ ভাষা সমর্থন করে।

সঙ্গীত এবং এফেক্টসName

সহজ সঙ্গীত এবং পরিবেশগত শব্দ তৈরি করতে পারে।

স্পিকারের প্রাক- নির্ধারিত মান

বিভিন্ন ধরনের একাধিক পূর্ব- প্রশিক্ষিত স্পিকার কণ্ঠস্বর।

ওপেন সোর্স

এমআইটি লাইসেন্সকৃত, সম্পূর্ণ বাণিজ্যিক ব্যবহারের অধিকার সহ।

ব্যবহারের ক্ষেত্রে

অক্ষর ডায়ালগ অ্যানিমেটেড বিষয়বস্তু অডিওবইয়ের বর্ণনা খেলার শব্দ সৃজনশীল প্রকল্প এক্সপ্রেশন সহায়ক

পাতলা Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

ব্যবহারের নিয়ম পাতলা

  1. 1

    বিনামূল্যে নিবন্ধন করুন এবং ডেমো খুলুন

    Create a free TextToSpeechAI account to claim your starter credits, or use the no-signup demo to try Bark right away. Free credits are enough to generate several expressive Bark clips before you upgrade.

  2. 2

    একটি বার্ক শব্দ বেছে নিন

    শব্দ লাইব্রেরী খুলুন এবং একটি বার্ক স্পিকার প্রাক-নির্ধারিত নির্বাচন করুন যা আপনি চান টোন মিলবে। বার্ক শব্দ ট্যাগ করা আছে হিসাবে প্রিমিয়াম স্তর (২৫ ক্রেডিট প্রতি ১০০০ অক্ষর) এবং আবেগপূর্ণ, অক্ষর-শৈলী বর্ণনা জন্য টুইন করা হয়েছে।

  3. 3

    ইমোট- মার্কার সহ টেক্সট লিখুন

    আপনার স্ক্রিপ্ট টাইপ করুন এবং লাইনটিতে Bark emotion markers অন্তর্ভুক্ত করুন: হাসি দেখানোর জন্য [হাসি], চিৎকার করার জন্য [চিৎকার], শ্বাস নেওয়ার জন্য [শ্বাস নেওয়া],... বিরতি নেওয়ার জন্য, এবং জোর দেওয়ার জন্য CAPS। উদাহরণস্বরূপ: "ওহ ওয়াও! [হাসি] এটা অসাধারণ... আমি বিশ্বাস করতে পারছি না!"

  4. 4

    অডিও তৈরি করুন

    ক্লিক করুন উত্‍পাদন এবং বার্ক আপনার লেখাকে অভিব্যক্তিমূলক কথায় রূপান্তর করে, প্রতিটি চিহ্নকে যথাযথ শব্দে পরিণত করে। বার্কের ট্রান্সফরমার মডেলের কারণে, বার্কের উৎ‍পাদন হালকা ইঞ্জিনের চেয়ে ধীর, তাই প্রতিটি বাক্যকে কয়েক সেকেন্ড অতিরিক্ত সময় দিন।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    ফলাফল প্রাকদর্শন করুন, তারপর এটি MP3, WAV, অথবা OGG হিসাবে ডাউনলোড করুন। আপনার নিজের অ্যাপলিকেশনে বার্ক স্বয়ংক্রিয় করতে, বার্ক শব্দ এবং একই মার্কার-সমৃদ্ধ টেক্সট সহ TextToSpeechAI API কল করুন, যাতে অডিওটি প্রকাশিত হয়।

পাতলা অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ওহ ওয়াও! [হাসি] এটা অসাধারণ... আমি এটাকে কতটা প্রকাশ্য মনে করি!",
    "voice": "bark-zh_0"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

বার্ক একটি ট্রান্সফরমার ভিত্তিক টেক্সট-টু-অডিও মডেল যা সুনো দ্বারা তৈরি করা হয়েছে। ঐতিহ্যবাহী TTS সিস্টেমের বিপরীতে, বার্ক প্রাকৃতিক আবেগ, হাসি, চিৎকার এবং অন্যান্য অবাক্যগত শব্দ সহ উচ্চাঙ্গ বাক্য তৈরি করে। এটি এমনকি সঙ্গীত এবং শব্দ প্রভাব তৈরি করতে পারে।

হ্যাঁ, বার্ক MIT লাইসেন্সের অধীনে উন্মুক্ত উৎস, যা বাণিজ্যিক ব্যবহারের জন্য বিনামূল্যে। TextToSpeechAI এর ক্ষেত্রে, আমরা প্রতি 1000 অক্ষরের জন্য 25 ক্রেডিট গ্রহণ করি কারণ এর জন্য উল্লেখযোগ্য GPU সম্পদ প্রয়োজন।

বার্ক ১৩+ ভাষা সমর্থন করে যার মধ্যে আছে ইংরেজি, জার্মান, স্প্যানিশ, ফরাসি, হিন্দি, ইতালিয়ান, জাপানি, কোরীয়, পোলিশ, পর্তুগিজ, রুশ, তুর্কি এবং চীনা। প্রত্যেক ভাষার নিজস্ব উচ্চারণ এবং উচ্চারণ আছে।

বার্ক অধিকাংশ টিটিএস ইঞ্জিনের চেয়ে ধীর, কারণ এর স্বয়ংক্রিয়ভাবে হ্রাসশীল ট্রান্সফরমার স্থাপত্য। একটি সাধারণ বাক্য তৈরি করতে জিপিইউতে ৫-১৫ সেকেন্ড সময় লাগে। এর ফলে আউটপুট অনেক বেশি পরিষ্কার ও স্বাভাবিক হয়।

Bark শুধুমাত্র "সিম্যান্টিক প্রম্পট" এবং স্পিকার প্রাক-নির্ধারিত ব্যবহার করে সীমিত ভয়েস ক্লোন প্রদান করে, তাই এটি একটি নমুনা থেকে একটি স্বতন্ত্র ভয়েস ক্লোন করতে পারে না। যদি আপনার লক্ষ্য সম্পূর্ণ ভয়েস ক্লোন করা হয়, তাহলে এর পরিবর্তে F5-TTS, StyleTTS2, OpenVoice, অথবা Tortoise ব্যবহার করুন, যা TextToSpeechAI-এ সমস্ত উপলব্ধ।

বার্ক আপনার লেখায় সরাসরি রাখা ইনলাইন মার্কার পড়ে এবং সেগুলোকে মিলযুক্ত শব্দে রূপান্তর করে । হাসি দেখানোর জন্য [laugh] ব্যবহার করুন, চিৎকার করার জন্য [sighs], শ্বাস নেওয়ার জন্য [gasps],... দ্বিধা বা বিরতি দেখানোর জন্য, এবং জোর দেওয়ার জন্য ক্যাপস ব্যবহার করুন । উদাহরণ: "ওহ ওয়াও! [laugh] এটা অসাধারণ... আমি বিশ্বাস করতে পারছি না!"

সাধারন কথা বলার বাইরে, বার্ক হাসির মতো অবাক্যগত শব্দ, শ্বাসকষ্ট, গলা ফাটিয়ে ফেলার শব্দ, গলা ফাটিয়ে ফেলার শব্দ এবং ঝাঁকুনি, আর এর সাথে সাধারন সঙ্গীত এবং পরিবেশগত প্রভাব তৈরি করতে পারে। এই সব শব্দের জন্যে [হাসি], [শ্বাসকষ্ট] এবং [গলা ফাটিয়ে ফেলার শব্দ] এর মতো চিহ্ন ব্যবহার করা হয়, যা বার্ককে সাধারণ টিটিএসের চেয়ে অনেক বেশি প্রকাশশীল করে তোলে।

বার্ক খুব ভাল মানের অডিও তৈরি করে যা প্রাকৃতিকভাবে প্রকাশ করে যা মানুষের কথার সাথে প্রতিদ্বন্দ্বিতা করে আবেগপূর্ণ বিষয়বস্তুতে। ২৪ কে- এইচ- জি আউটপুট পেশাদার শোনায়, যদিও পরিষ্কার কথার গুণমান StyleTTS2 এর চেয়ে কিছুটা কম।

মডেলের আকার অনুযায়ী Bark-এর জন্য ৮-১২GB VRAM প্রয়োজন। পূর্ণ মডেলের জন্য প্রয়োজন ~১২GB, ছোট ধরনের ক্ষেত্রে ৮GB যথেষ্ট। CPU inference অত্যন্ত ধীর এবং সুপারিশ করা হয় না।

Yes, Bark is MIT licensed, which permits unrestricted commercial use with no licensing fees. You can use Bark in products, services, and applications freely. On TextToSpeechAI you can try Bark free using your signup credits before paying for more.

Bark excels at expressive single-speaker speech with emotion markers like [laughter] and [sighs], while Dia is built for multi-speaker dialogue with [S1]/[S2] turns and nonverbal cues. Choose Bark for emotional narration and character voice, and Dia for back-and-forth conversations. Both are available on TextToSpeechAI.

বার্কের অসাধারণ বৈশিষ্ট্য হল, এটি আবেগ এবং অবাচক শব্দ সহকারে সত্যিকার অর্থে অভিব্যক্তিমূলক কথাবার্তা তৈরি করতে পারে। এটি অন্যান্য ইঞ্জিনের চেয়ে ধীরগতির, কিন্তু সৃজনশীল বিষয়বস্তু তৈরির জন্য এটি মানুষের মতো শব্দ তৈরি করে। দ্রুত সংশ্লেষণের জন্য পাইপার ব্যবহার করুন। শব্দ ক্লোন করার জন্য F5- TTS বা OpenVoice ব্যবহার করুন।

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try পাতলা Now

Generate your first audio free. No credit card required.

Start Free