Slow
ፍጥነት
Very Good
ጥራት
አዎ
መተላለፊያ
13
ቋንቋዎች
ስለ ቅርጽ
s of speech that are not heard by humans. Bark is a
የቁልፍ ባህሪያት
የልብ ትር
ድምፅን በጨዋታ፣ በጭንቀት፣ በጭንቀት እና በቅን ፍላጎት ያፈጥሩ።
ሐሳብ
[ስሜት], [አፍንጫ], CAPS ለተጨባጭነት, እና... ለተጠራጣሪነት ይጠቀሙ.
ብዙ ቋንቋዎች
13+ ቋንቋዎች ጋር ተፈጥሯዊ accents እና ተናጋሪ ይደግፋል.
ሙዚቃ እና ውጤቶች
ቀላል ሙዚቃ እና የባህርይ ድምፆችን ማምረት ይችላል
የድምፅ አሰጣጥ
ብዙ የቀድሞው-ተስተካከለ ተናጋሪ ድምጾች በተለያዩ ስዕሎች
የክፍል ፋይል
MIT ፈቃድ በሙሉ የኮሜርሺያል ጥቅም መብቶች
ጥቅም
የፊደል ቅርጽ አሞሌ
የጽሑፍ ይዘት
የድምፅ መጽሐፍ
የጨዋታውን የድምፅ አሰራር
የቀን መቁጠሪያ ዕቅድ
የጽሑፍ ረዳቶች
ቅርጽ Voices
View All 130Bark Chinese Speaker 0
ZHBark Chinese Speaker 1
ZHBark Chinese Speaker 2
ZHBark Chinese Speaker 3
ZHBark Chinese Speaker 4
ZHBark Chinese Speaker 5
ZHBark Chinese Speaker 6
ZHBark Chinese Speaker 7
ZHBark Chinese Speaker 8
ZHBark Chinese Speaker 9
ZHBark English Speaker 0
ENBark English Speaker 1
ENብዙ ጊዜ የሚጠየቁ ጥያቄዎች
ባርክ በሱኖ የተፈጠረ የትራንስፎርመር የተመሠረተ ጽሑፍ-ወደ-ድምፅ ሞዴል ነው. እንደ ጥንታዊው የTTS ስርዓቶች ባይሆንም፣ ባርክ በባህላዊ ስሜቶች፣ በቁጭት፣ በጭንቅላት መጎተት፣ በሌሎችም ያልሆኑ ድምጾች ከፍተኛ ግልጽ ንግግርን ያመነጫል። ሙዚቃንና የድምፅ ውጤቶችንም ሊፈጥር ይችላል።
አዎ, Bark በ MIT ፈቃድ ስር የከፈተ ምንጭ ነው, ነፃ የቢዝነስ ጥቅም ያስችላል. በ TextToSpeechAI ላይ, እኛ 25 ክሬዲቶች በ 1000 አሃዞች ምክንያት ለ ማምረት የሚያስፈልገው ትልቅ GPU ምንጮች ይከፈል.
ባርክ 13+ ቋንቋዎች አማርኛ, ጀርመን, ስፓኒሽ, ፈረንሳይኛ, ሃንዲ, ጣሊያንኛ, ጃፓንኛ, ኮሪያኛ, ፖላንድኛ, ፖርቱጋልኛ, ሩሲያኛ, ቱርክኛ, እና ቻይንኛ ጨምሮ ይደግፋል. ቋንቋ ሁሉ ተፈጥሯዊ ተናጋሪ እና accents አለው.
ባርክ ከብዙ የቲቲኤስ ማሽኖች የበለጠ ዝቅተኛ ነው ምክንያቱም የራስ-መለወጫ ትራንስፎርመር አርክቴክቸር ነው. የተለመደው ሐረግ በጂፒዩ ላይ ለመፍጠር 5-15 ሰከንዶች ይወስዳል. የግብይት ዋጋው የበለጠ ግልጽ እና ተፈጥሯዊ ውጤት ነው.
ባርክ የድምፅ ክሎኒንግን በ"ሴማቲክ ፕሮምፕቶች" በመጠቀም ያስተካክላል - የድምፅ አዳሚዎችን መቀመጫዎች መጠቀም ይችላሉ ግን በፍጥነት የድምፅ ክሎኒንግ ማድረግ አይችሉም. ለሙሉ የድምፅ ክሎኒንግ፣ StyleTTS2, F5-TTS, OpenVoice, ወይም Tortoise በመጠቀም ይተዉት።
በጽሑፍህ ውስጥ የስነ-ልቦና ምልክቶችን ይጠቀሙ፦ [ስሜት] ለስሜት፣ [ስሜት] ለጭንቀት፣ [ጭንቀት] ለጭንቀት፣... ለጥርጣሬ፣ CAPS ለጥቅልነት። ምሳሌ፦ "ኦ ዋው! [ስሜት] ይህ አስደናቂ ነው... አምናለሁ!"
ባርክ በጣም ጥሩ ጥራት ያለው ድምፅን ለስነ-ልቦናዊ ይዘት ሰውን የሚወዳደር ተፈጥሯዊ መግለጫ ጋር ያወጣል. የ 24kHz ውጤቱ የሙያ ድምፅ ነው ፣ ምንም እንኳን የጥሩ ንግግር ጥራት ከ StyleTTS2 ትንሽ ዝቅተኛ ነው ፡፡
ባርክ በሞዴል መጠን ላይ በመመርኮዝ 8-12GB የቪሬም ያስፈልጋል. ሙሉ ሞዴሉ ~12GB ያስፈልጋል፣ ይልቁንም ትንሽ ቫሪያንቶች በ8GB ይሠራሉ. የሲፒዩ ውጤት በጣም ዝቅተኛ ነው እናም አይመከርም
አዎ፣ ባርክ የኤም.አይ.ቲ. ፈቃድ ያለው ሲሆን ይህም የኮሜርሺያል ጥቅም እንዲፈቀድ ያስችላል። በምርቶች፣ በህክምና እና በፕሮግራሞች ላይ ያለ ፈቃድ ክፍያ መጠቀም ትችላላችሁ።
ከድምፅ መጻሕፍት መዝገብ ቤት ውስጥ የባክ ድምፅን ይምረጡ እና በጽሑፍዎ ውስጥ የስነ-ልቦና ምልክቶችን ያካትቱ። API ጥያቄዎን ይሠራል እና የተገለጹትን የስነ-ልቦና ምልክቶች የያዘ ድምፅን ይመልሳል
በርክ WAV ድምፅ በነፃ ያወጣል. በ TextToSpeechAI, MP3, WAV ወይም OGG ቅርጸቶች መጠየቅ ይችላሉ. እኛ ቅርጸት ለውጥ በማድረግ ወቅት ግልጽ ባህሪያትን መጠበቅ እንሰራለን.
ባርክ በውስጡ ውስጣዊ ስሜት እና ያልተናገረ ድምፅ ያለውን እውነተኛ የቃል መግለጫ ለማምረት የሚያስችል ችሎታ አለው፡፡ ከሌሎች ማሽኖች ይበልጥ ዝቅተኛ ነው ግን ለፈጠራ ይዘት የበለጠ ሰው-አማኝ ውጤቶችን ያመጣል፡፡ ለፍጥነት ያለው ማቀነባበር፣ ፓይፐርን ይጠቀሙ። ለድምፅ ክሎኒንግ፣ F5-TTS ወይም ኦፕንቮይስን ይጠቀሙ።
Technical Specs
- Generation Speed Slow
- Output Quality Very Good
- Voice Cloning Not Supported
- Languages 13
- GPU VRAM 8-12GB
- Credits/1000 chars 25