शेल

Premium

भावना व ध्वनी प्रभाव सह अभिव्यक्त AI भाषणName

Slow वेग
Very Good गुणवत्ता
नाही क्लोन
13 भाषाName

विषयी शेल

-text-to-audio (TTS) sounds. Bark is the first TTS model to use the

मुख्य वैशिष्ट्ये

भावनिक अभिव्यक्ती

त्यांतील काही म्हणजे राग, राग, राग, राग, राग, राग, राग, राग, राग, राग, राग, राग.

इमोटिकॉन मार्कर

[हशा], [सगळे], भर घालण्यासाठी कॅप्स वापरा, आणि... संकोच करण्यासाठी.

बहुभाषिक

याशिवाय त्यांनी १३ भाषांत व ३२ भाषिकांच्या साहित्यात लेखन केले आहे.

संगीत व प्रभावName

संगीत आणि नृत्य यांचा संगम या नाटकात दिसतो.

स्पीकर पूर्वनिर्धारीत

अनेक मराठी भाषिकांनी विविध प्रकारच्या वृत्तपत्रांतून लेखन केले आहे.

ओपन सोर्स

याचे पूर्ण नाव ॲडव्होकेट जनरल ऑफ इंडिया.

वापरा प्रकरणे

अक्षर संवाद ऍनिमेटेड अनुक्रम ऑडिओबुक कथन खेळ आवाज कृती क्रिएटिव्ह प्रकल्प एक्सप्रेशिव सहायक

शेल Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

वापर कसे कराल शेल

  1. 1

    मोफत नोंदणी करा आणि डेमो उघडा

    TextToSpeechAI मोफत खाते तयार करा आणि आपल्या सुरुवातीच्या क्रेडिटची मागणी करा, किंवा Bark चा वापर करा, याची नोंदणी न करता. आपण अपग्रेड करण्यापूर्वी अनेक स्पष्ट Bark क्लिप्स तयार करण्यासाठी मोफत क्रेडिट पुरेसे आहे.

  2. 2

    बार्क आवाज निवडा

    आवाज लायब्ररी उघडा व तुम्हाला हवे त्या स्वराला जुळणारे बार्क स्पीकर पूर्वनिर्धारित निवडा. बार्क आवाज प्रीमियम स्तर म्हणून चिन्हांकित केले जातात (25 क्रेडिट प्रति 1000 अक्षरे) व भावनात्मक, अक्षर शैली कथन करीता सुसंगत केले जातात.

  3. 3

    इमॉटिकॉनसह पाठ्य प्रविष्ट करा

    स्क्रिप्ट टाइप करा व बार्क भावना चिन्ह अंतर्भूत करा: हसण्याकरीता [लहान], हळहळण्याकरीता [लहान], हळहळण्याकरीता [लहान],... थांबण्याकरीता, व भर घालण्याकरीता CAPS. उदाहरणार्थ: "ओ वा! [लहान] हे अद्भुत आहे... मला विश्वास बसत नाही!"

  4. 4

    ऑडिओ बनवा

    बनवा वर क्लिक करा व Bark तुमच्या पाठ्यला शब्दांत रूपांतरित करते, प्रत्येक चिन्ह जुळवणी करीता आवाज करीता बदलविते. Bark चे Transformer मॉडेल मुळे, निर्माण करणे हल्के इंजिन पेक्षा मंद आहे, म्हणून वाक्या करीता काही अतिरिक्त सेकंद द्या.

  5. 5

    API डाउनलोड करा किंवा वापरा

    परिणाम पूर्वदृश्य, MP3, WAV किंवा OGG म्हणून डाउनलोड करा. आपल्या स्वतःच्या अनुप्रयोगात Bark स्वचालित करण्यासाठी, Bark आवाज आणि समान marker-rich पाठ्यसह TextToSpeechAI API ला कॉल करा, अभिव्यक्तीपूर्ण ऑडिओ परत मिळविण्यासाठी.

शेल API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "अरे वा! [हशा] हे अद्भुत आहे... मला हे किती अभिव्यक्तीपूर्ण वाटते हे आवडते!",
    "voice": "bark-zh_0"
  }'

वारंवार विचारले जाणारे प्रश्न

Bark हे Suno द्वारे बनविलेले Transformer- आधारीत पाठ्य- ते- ऑडिओ मॉडेल आहे. पारंपारिक TTS प्रणालीप्रमाणेच, Bark नैसर्गिक भावना, हास्य, हळहळ व इतर अ- मौखिक आवाज सह अतिशय अभिव्यक्तीशील भाषण निर्माण करते. ते संगीत व ध्वनी प्रभाव निर्माण करू शकते.

Yes, Bark is open-source under the MIT license, allowing free commercial use. On TextToSpeechAI, we charge 25 credits per 1000 characters due to the significant GPU resources required for generation.

बार्क 13+ भाषा समर्थन इंग्रजी, जर्मन, स्पॅनिश, फ्रेंच, हिंदी, इटली, जपानी, कोरियाई, पोलिश, पोर्तुगीज, रशियन, तुर्की, आणि चिनी. प्रत्येक भाषा नैसर्गिक उच्चार आणि उच्चार आहे.

बार्क हे त्याच्या autoregressive transformer architecture मुळे बहुतेक TTS इंजिन पेक्षा मंद आहे. GPU वर एक सामान्य वाक्य तयार करण्यास5- 15 सेकंद लागतात. tradeoff हे अधिक स्पष्ट व नैसर्गिक आऊटपुट आहे.

बार्क फक्त "सेमाटिक प्रोम्ट" व स्पीकर पूर्वनिर्धारित द्वारे मर्यादित आवाज क्लोन प्रदान करते, म्हणून ते नमुन्यापासून अवैध आवाज विश्वासार्हरित्या क्लोन करू शकत नाही. पूर्ण आवाज क्लोन करणे तुमचे उद्दिष्ट असेल तर, TextToSpeechAI वर उपलब्ध सर्व F5-TTS, StyleTTS2, OpenVoice किंवा Tortoise वापरा.

बार्क तुमच्या पाठ्य अंतर्गत थेट टाकलेले इनलाईन मार्कर वाचतो व त्यांना जुळवणीजोगी आवाज करीता रूपांतरित करतो. हसण्याकरीता [laugh] वापरा, हळहळण्याकरीता [sighs], हळहळण्याकरीता [gasps],... संकोच किंवा खंडन करीता, व जोर देण्याकरीता CAPS वापरा. उदाहरण: "ओ वा! [laugh] हे अद्भुत आहे... मला विश्वास बसत नाही!"

साधारण बोलण्याव्यतिरिक्त, बार्क हसणे, श्वासोच्छवास, श्वास घेण्याची गती, घासणे, आणि वाकणे यांसारखे अ- शब्दात्मक आवाज निर्माण करू शकते, तसेच सोपे संगीत व पर्यावरणीय परिणाम. हे [लहान] [सकारात्मक] आणि [गंभीर] यासारख्या पाठ्यातील चिन्हांकनाने सुरू केले जाते, जे बार्कला मानक TTS पेक्षा अधिक अभिव्यक्तीशील बनवते.

[Translation temporarily unavailable. Please try again.]

बार्कला मॉडेल आकारावर अवलंबून VRAM च्या 8-12GB ची गरज असते. पूर्ण मॉडेलला ~12GB ची गरज असते, तर लहान व्हेरियंट 8GB बरोबर काम करतात. CPU इन्फरन्स अतिशय मंद आहे आणि सुचविले जात नाही.

होय, बार्क एमआयटी लाइसेन्स आहे, जे कोणत्याही परवाना शुल्काशिवाय असीमित व्यावसायिक वापरास परवानगी देते. तुम्ही बार्कचा उत्पादने, सेवा आणि अनुप्रयोगांमध्ये मोफत वापर करू शकता. TextToSpeechAI वर तुम्ही बार्कचा मोफत वापर करू शकता, अधिकसाठी पैसे देण्यापूर्वी तुमच्या नोंदणी क्रेडिटचा वापर करून.

बार्क एकल वक्ता संवादात [हशा] आणि [सगळे] यांसारख्या भावनात्मक चिन्हांसह अभिव्यक्तीशील एकल वक्ता भाषणात उत्कृष्ट आहे, तर डाय [S1] / [S2] कडे वळणे आणि अ-शब्दात्मक सूचकांसह बहु-भाषक संवादासाठी बनविले आहे. भावनात्मक वर्णन आणि व्यक्तिमत्त्व आवाजासाठी बार्क निवडा, आणि डाय नंतर आणि पुढे संवादासाठी. दोन्ही TextToSpeechAI वर उपलब्ध आहेत.

बार्क चे वैशिष्ट्य म्हणजे भावना व अ- शब्दात्मक आवाज सह खरोखरच अभिव्यक्तीशील भाषण निर्माण करण्याची क्षमता. ते इतर इंजिनपेक्षा मंद आहे परंतु रचनात्मक विषयवस्तु करीता अधिक मानवी परिणाम निर्माण करते. जलद संश्लेषण करीता, Piper चा वापर करा. आवाज क्लोन करीता, F5- TTS किंवा OpenVoice चा वापर करा.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try शेल Now

Generate your first audio free. No credit card required.

Start Free