பழம்

Premium

உணர்வுகள் மற்றும் ஒலி விளைவுகளுடன் வெளிப்படுத்தும் AI பேச்சுName

Slow வேகம்
Very Good தரம்
இல்லை மாதிரியாக்கம்
13 மொழிகள்

& பற்றி பழம்

-text audio. Bark is the first TTS model to use the

முக்கியமான அம்சங்கள்

உணர்வு வெளிப்பாடு

சிரிப்பு, சிந்தனை, குரல், மற்றும் உண்மையான உணர்வுகளுடன் பேசி உருவாக்கவும்.

உணர்வு குறிகள்

[சிரிப்பு], [சிந்தனை], CAPS வலியுறுத்தல், மற்றும்... தயக்கம் பயன்படுத்தவும்.

பல மொழிகள்

இயற்கையான உச்சரிப்பு மற்றும் உச்சரிப்புகளுடன் 13+ மொழிகளுக்கு ஆதரவு.

இசை & விளைவுகள்

எளிய இசை மற்றும் சுற்றுச்சூழல் ஒலிகளை உருவாக்க முடியும்.

ஒலியமைப்பு

பல முன் பயிற்சி பெற்ற ஒலிப்பதிவாளர்கள் குரல்கள் வேறுபட்ட பாணிகளுடன்.

திறந்த மூலங்கள்

MIT முழு வணிக பயன்பாட்டு உரிமைகளுடன் லைசென்ஸ் பெற்றது.

பயன்பாட்டு வழக்கங்கள்

எழுத்து உரையாடல் அசைவூட்ட உள்ளடக்கம் ஒலிப்புத்தக உரையாடல் விளையாட்டு குரல் செயல்பாடு உருவாக்கு திட்டங்கள் எக்ஸ்பிரஸ்விவ் உதவியாளர்கள்

பழம் Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

பயன்படுத்துவது எப்படி பழம்

  1. 1

    இலவசமாக பதிவு செய்து, காட்சியை திறக்கவும்

    உங்கள் துவக்கக் கடன்களைக் கோர ஒரு இலவச TextToSpeechAI கணக்கை உருவாக்கவும், அல்லது பார்க் உடனடியாக முயற்சிக்க பதிவு செய்யாத டெமோவைப் பயன்படுத்தவும். நீங்கள் மேம்படுத்துவதற்கு முன் பல வெளிப்படையான பார்க் கிளிப்களை உருவாக்க இலவசக் கடன்கள் போதுமானவை.

  2. 2

    ஒரு குரலை தேர்ந்தெடு

    குரல் நூலகத்தை திறந்து நீங்கள் விரும்பும் ஒலிக்கு ஏற்ற ஒரு பாக் பேச்சாளர் முன் அமைப்பை தேர்ந்தெடு. பாக் குரல்கள் பிரீமியம் தரமாக குறிக்கப்பட்டுள்ளன (1000 எழுத்துக்களுக்கு 25 கடன்கள்) மற்றும் உணர்ச்சிகரமான, எழுத்து வடிவம் கூறுவதற்கு அமைக்கப்பட்டுள்ளன.

  3. 3

    உணர்வுரு குறிகளுடன் உரை உள்ளிடு

    உங்கள் எழுத்துருவை உள்ளிடவும் மற்றும் பாக் உணர்வு குறிகளை உள்ளடக்கவும்: [சிரிப்பு] சிரிப்பதற்கு, [சிரிப்பு] சிந்தனைக்கு, [காற்று] காற்றுக்கு,... தற்காலிகமாக, மற்றும் CAPS வலியுறுத்தலுக்கு. உதாரணம்: "ஓ வாவ்! [சிரிப்பு] இது அற்புதம்... நான் அதை நம்ப முடியாது!"

  4. 4

    ஒலியை உருவாக்கு

    உருவாக்கு என்பதை க்ளிக் செய்யவும். பாக் உங்கள் உரையை உணர்வுபூர்வமான உரையாடலாக மாற்றும், ஒவ்வொரு குறியும் ஒத்த ஒலியாக மாறும். பாக் மாற்று மாதிரி காரணமாக, எளிய இயந்திரங்களை விட உருவாக்கம் மெதுவாக உள்ளது, எனவே ஒவ்வொரு வாக்கியத்திற்கும் சில கூடுதல் நொடிகள் அனுமதிக்கவும்.

  5. 5

    API ஐ பதிவிறக்கவும் அல்லது பயன்படுத்தவும்

    முடிவுகளை முன்பார்வையிடு, பின்னர் MP3, WAV, அல்லது OGG ஆக பதிவிறக்கு. உங்கள் பயன்பாட்டில் தானாகவே பார்க் செய்ய, TextToSpeechAI API ஐ ஒரு பார்க் குரலுடன் அழைக்கவும் மற்றும் அதே குறியிடும்-உயர் உரை, உணர்ச்சிகரமான ஒலியை திரும்ப பெற.

பழம் API

TextToSpeechAI REST API ஐப் பயன்படுத்தி மென்பொருள் மூலம் பேசி உருவாக்கவும்.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ஓ வாவ்! [சிரிப்பு] இது அற்புதம்... நான் எப்படி வெளிப்படுத்தும் இந்த ஒலியை நேசிக்கிறேன்!",
    "voice": "bark-zh_0"
  }'

அடிக்கடி கேட்கப்படும் கேள்விகள்

பார்க் ஒரு மாற்று- அடிப்படை உரை- ஒலி மாதிரி சுனோ உருவாக்கியுள்ளது. பாரம்பரிய TTS அமைப்புகளை விட, பார்க் இயற்கை உணர்வுகள், சிரிப்பு, சிந்தனைகள் மற்றும் மற்ற வார்த்தை இல்லாத ஒலிகளுடன் மிகவும் வெளிப்படையான பேச்சை உருவாக்குகிறது. இது இசை மற்றும் ஒலி விளைவுகளையும் உருவாக்க முடியும்.

ஆம், பார்க் MIT லைசென்ஸ் கீழ் திறந்த மூலமாகும், இலவச வணிக பயன்பாட்டை அனுமதிக்கிறது. TextToSpeechAI இல், நாம் 1000 எழுத்துக்களுக்கு 25 கிரெடிட்களை வசூலிக்கிறோம், ஏனெனில் உருவாக்கத்திற்கு தேவையான முக்கியமான GPU மூலங்கள்.

பார்க் 13+ மொழிகளை ஆதரிக்கின்றது, அவை ஆங்கிலம், ஜெர்மன், ஸ்பானிஷ், பிரெஞ்சு, இந்தி, இத்தாலியன், ஜப்பானியம், கொரியன், போலிஷ், போர்ச்சுகல், ரஷ்ய, துருக்கி, சீனம். ஒவ்வொரு மொழிக்கும் இயற்கையான உச்சரிப்பு மற்றும் உச்சரிப்புகள் உள்ளன.

பார்க் பெரும்பாலான TTS இயந்திரங்களை விட மெதுவாக உள்ளது ஏனெனில் அதன் தானாகவே திரும்பும் மாற்று கட்டமைப்பு. ஒரு பொதுவான வாக்கியம் GPU யில் உருவாக்க 5- 15 விநாடிகள் எடுக்கும். மாற்று மிகவும் வெளிப்படையான மற்றும் இயற்கையான வெளியீடு.

"செமன்டிக் ப்ரீஃபீல்டுகள்" மற்றும் ஒலிப்பதிவு முன் அமைப்புகள் மூலம் குறைந்த குரல் ஒத்தமைப்பை மட்டுமே பார்க் வழங்குகிறது, எனவே இது ஒரு மாதிரியில் இருந்து ஒரு குறிப்பிட்ட குரலை நம்பகமாக ஒத்தமைக்க முடியாது. முழு குரல் ஒத்தமைப்பு உங்கள் இலக்காக இருந்தால், F5-TTS, StyleTTS2, OpenVoice, அல்லது Tortoise ஐ பயன்படுத்தவும், அனைத்தும் TextToSpeechAI ல் கிடைக்கும்.

பாக் உரையிலுள்ள உள்ளமைந்த குறிகளை படிக்கிறது மற்றும் அவற்றை ஒத்து வரும் ஒலிகளாக மாற்றுகிறது. சிரிப்பதற்கு [சிரிப்பு] பயன்படுத்தவும், [சிரிப்பு] சிந்தனைகளுக்கு, [காற்று] காற்று,... தயக்கம் அல்லது தற்காலிகமாக, மற்றும் CAPS வலியுறுத்தலுக்கு. உதாரணம்: "ஓ வாவ்! [சிரிப்பு] இது அற்புதம்... நான் நம்ப முடியாது!"

சுலபமான பேச்சை தவிர, பார்க் சிரிப்பு, சிந்தனை, மூச்சு, தொண்டை சுத்தப்படுத்துதல், மற்றும் ஸ்டட்டர்ஸ் போன்ற வார்த்தை இல்லாத ஒலிகளை உருவாக்க முடியும், மேலும் எளிய இசை மற்றும் சூழல் விளைவுகள். இவை [சிரிப்பு], [மூச்சு], மற்றும் [மூச்சு] போன்ற உரைக்குள் உள்ள குறிகள் மூலம் இயக்கப்படுகின்றன, இது பார்க் தரமான TTS யை விட அதிகமாக உணர்த்துகிறது.

பார்க் மனித உரையாடலை உணர்ச்சிபூர்வமான உள்ளடக்கங்களுக்காக போட்டியிடக்கூடிய இயற்கையான வெளிப்பாட்டுடன் மிகவும் நல்ல தரமான ஒலியை உருவாக்குகிறது. 24kHz வெளியீடு தொழில்முறையாக உள்ளது, ஆனால் சுத்தமான உரையாடல் தரம் StyleTTS2 க்கு சற்று கீழே உள்ளது.

பார்க் வடிவ அளவை பொறுத்து 8-12GB VRAM தேவைப்படுகிறது. முழு வடிவத்திற்கு ~12GB தேவைப்படுகிறது, ஆனால் சிறிய வடிவங்கள் 8GB ஐ பயன்படுத்துகின்றன. சிபியு ஈடுபாடு மிகவும் மெதுவாக உள்ளது மற்றும் பரிந்துரைக்கப்படவில்லை.

ஆம், பார்க் MIT லைசென்ஸ் பெற்றது, இது எந்த லைசென்ஸ் கட்டணமும் இல்லாமல் வரம்பு இல்லாத வணிக பயன்பாட்டை அனுமதிக்கிறது. நீங்கள் பார்க் பொருட்களில், சேவைகளில், மற்றும் பயன்பாடுகளில் இலவசமாக பயன்படுத்தலாம். TextToSpeechAI இல் நீங்கள் பார்க் இலவசமாக முயற்சி செய்யலாம் உங்கள் பதிவு கடன்களை பயன்படுத்தி அதிகம் செலுத்தும் முன்.

[சிரிப்பு] மற்றும் [சிந்தனை] போன்ற உணர்வு குறிகள் கொண்ட ஒரு- ஒற்றை- ஒலிப்பதிவு உரையாடலில் பார்க் சிறந்து விளங்குகிறது, ஆனால் டயா [S1] / [S2] சுழற்சிகள் மற்றும் வார்த்தை இல்லாத குயிஸ்களுடன் பல- ஒலிப்பதிவு உரையாடலுக்கு உருவாக்கப்பட்டுள்ளது. உணர்வுரீதியான கதை சொல்லல் மற்றும் எழுத்துரு குரலுக்கு பார்க் தேர்ந்தெடுக்கவும், டயா பின்னோக்கி மற்றும் முன்னோக்கி உரையாடலுக்கு. இரண்டும் TextToSpeechAI இல் கிடைக்கும்.

உணர்வுகள் மற்றும் வார்த்தை இல்லாத ஒலிகளுடன் உண்மையான வெளிப்படுத்தும் பேச்சை உருவாக்கும் திறனில் பார்க் தனித்துவமானது. இது மற்ற இயந்திரங்களை விட மெதுவாக உள்ளது ஆனால் உருவாக்கு உள்ளடக்கத்திற்கு மனிதர் போன்ற பலன்களை உருவாக்குகிறது. வேகமான சேர்க்கைக்கு, பைப்ரரை பயன்படுத்தவும். குரல் ஒத்திசைவுக்கு, F5- TTS அல்லது திறந்த குரலை பயன்படுத்தவும்.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try பழம் Now

Generate your first audio free. No credit card required.

Start Free