ስለ ቻተርቦክስ
Chatterbox is a powerful voice cloning TTS model from Resemble AI. It performs zero-shot voice cloning from just a few seconds of reference audio, supporting 23 languages with natural expression. Chatterbox includes paralinguistic tags for adding natural sounds like laughter and coughs to generated speech.
የቁልፍ ባህሪያት
የድምፅ ቅጂ
ከጥቂት ሰከንዶች የድምፅ ድምፅ ክሎን - ምንም ስልጠና ያስፈልጋል.
ቋንቋዎች
ከዐረብኛ እስከ ቻይንኛ፣ የዓለምን ዋና ዋና ቋንቋዎች የሚሸፍን ነው።
ፊደል(ሎች)
[ስሜት], [አፍንጫ], [አፍንጫ] ለተፈጥሮአዊ paralinguistic ድምፆች ጨምር.
የፍጥነት ማጣቀሻ
የቱርቦ አማራጭ ለነጻ ጊዜ ፕሮግራሞች
ጥቅም
የድምፅ ክሎኒንግ ለ ይዘት መፍጠር
የድምፅ ፕሮግራሞች
የፊደል ቅርጽ ድምጽ
የግል የድምፅ ረዳቶች
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
ቻተርቦክስ ከ Resemble AI የድምፅ ክሎኒንግ TTS ሞዴል ነው. ከጥቂት ሰከንዶች ብቻ የመዝገብ ድምፅ ማንኛውንም ድምፅ ሊመልስ ይችላል እና በ 23 ቋንቋዎች ውስጥ ተፈጥሯዊ ንግግርን ያመነጫል.
አዎ፣ ቻተርቦክስ በሙሉ የ MIT ፈቃድ ነው - ኮድ እና ሞዴል ክብደቶች. በኮሜርሺያል አፕሊኬሽኖች ውስጥ ነፃነት ሊጠቀም ይችላል። የተፈጠረው ድምፅ የተሻሻለ የኒውሮን ውሃ ምልክት ያካትታል ይህም ሊሰረዝ ይችላል።
ቻተርቦክስ 23 ቋንቋዎችን ይደግፋል: ዐረብኛ, ዴንማርክኛ, ጀርመንኛ, ግሪክኛ, አማርኛ, ስፓኒሽ, ፊኒሽ, ፈረንሳይኛ, ዕብራይስጥ, ሃንዲ, ጣሊያንኛ, ጃፓንኛ, ኮሪያኛ, ማላይ, ደች, ኖርዌይኛ, ፖሊሽ, ፖርቱጋልኛ, ሩሲያኛ, ስዊድንኛ, ስዋሂሊ, ቱርክኛ, እና ቻይንኛ.
የድምፅ መዝገብ ቤትን መዝገብ ቤት ያዘጋጁ (ከጥቂት ሰከንዶች በኋላ)። ቻተርቦክስ የድምፅ ባህሪያትን ያወጣል ከዚያም አዲስ ንግግርን በድምፅ ውስጥ ማምረት ይችላል። ምንም ማስተካከያ ወይም ስልጠና ያስፈልጋል
የቻተርቦክስ መተግበሪያ በጽሑፍዎ ውስጥ የተለየ መለያ ምልክት ይደግፋል፦ [laugh] ለስሜት፣ [cough] ለጉንፋን፣ [chuckle] ለጉንፋን፡፡ እነዚህም ወደሚፈጠረው ንግግር ተፈጥሯዊ ያልሆኑ ድምፆችን ያጨምራሉ፡፡
የዋና አማራጭ በጂፒዩ ላይ ምላሽ በፍጥነት ያመጣል. የቱርቦ አማራጭ 200 ሚሊሴኮንዶች ላቴንሲን ያገኛል፣ ለወቅታዊ የንግግር ፕሮግራሞች ተስማሚ ያደርገዋል
ቻተርቦክስ በየጊዜው የሚለወጥ ሲሆን 4-8GB VRAM ያስፈልጋል። ስታንዳርድ ሞዴሉ በ6GB ይሠራል፣ ቱርቦ ደግሞ 4GB ያስፈልጋል።
ሁለቱም የድምፅ ክሎኒንግን ይደግፋሉ፣ ግን ቻተርቦክስ ብዙ ቋንቋዎችን ይደግፋል (23 vs 2) እና ግልጽ ምልክቶችን ያካትታል። F5-TTS ለአንግሊዝኛ ትንሽ የበለጠ ተፈጥሯዊ ድምፅ ሊፈጥር ይችላል። ለብዙ ቋንቋ ክሎኒንግ ቻተርቦክስን ይምረጡ።
ሁለቱም በጥሩ ጥራት የድምፅ ክሎኒንግ ያቀርባሉ. ቻተርቦክስ 23 ቋንቋዎችን በነጻ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በነፃ ድምፅ በ
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 23
- GPU VRAM 4-8GB
- Credits/1000 chars 25