ስለ ቀን
ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from
የቁልፍ ባህሪያት
የመደቡን ቅርጸት
በተለያዩ ድምጾችና ዙር በመውሰድ ተፈጥሯዊ የብዙ-ተናጋሪ ውይይቶችን ይፈጥሩ
የድምፅ መጠን
[የሚስቅ], [የሚስቅ], [የሚስቅ], (የሚስቅ) ለተፈጥሮአዊ የቋንቋ መግለጫዎች ጨምር
የድምፅ ቅጂ
የድምፅ ፋይል
ምናሌ
1.6B ፓራሜትሮች በጣም ተፈጥሯዊ የንግግር ፀጉር እና ድምፅን ያመጡታል.
ጥቅም
የዳታ ፋይል
የድምፅ መጽሐፍ ምርት በብዙ ፊደላት
የጨዋታ ፊደል ቅርጽ
የፖድካስት እና የይዘት መፍጠር
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
Dia ከ Nari Labs የተገኘ የ1.6B ፐራሜትር የዳያሎግ-ተኮር ጽሑፍ-ወደ-ንግግር ሞዴል ነው. ለብዙ ተናጋሪዎች፣ ለነጠላ ድምፆች፣ ለድምፅ ክሎኒንግ ድጋፍ ያለውን ተፈጥሯዊ የንግግር ንግግር በማምረት ላይ ያተኮረ ነው
አዎ, Dia በሙሉ Apache 2.0 ፈቃድ ነው - ኮድ እና ሞዴል ክብደት. በነፃ በኮሜርሲያል ፕሮግራሞች ውስጥ ሊጠቀም ይችላል.
በወቅቱ Dia አማርኛ ብቻ ይደግፋል. ሞዴሉ ለነፃ አማርኛ ቃለ ምልልስ የተሻሻለ ነው.
ዲያ በጽሑፍዎ ውስጥ የተለየ መለያ ምልክቶችን ይደግፋል: ለስሜት [ለስሜት], ለጭንቀት [ለጭንቀት], ለጭንቀት [ለጭንቀት], ለጭንቀት (ለጭንቀት) እነዚህ ተናጋሪውን የበለጠ እውነተኛ ለማድረግ ተፈጥሯዊ ያልሆኑ ድምፆችን ያጠቃልላሉ.
[S1] እና [S2] መለያዎችን በመጽሐፍዎ ውስጥ የተለያዩ ተናጋሪዎችን ለማሳየት ይጠቀሙ. Dia ለእያንዳንዱ ተናጋሪ የተለየ ድምፅን በነፃነት የመውሰድ እና የመነጋገር ዳይናሚክነት ጋር ያመጣል.
ሁለቱም የቃላት ያልሆኑ ድምጾችን ይደግፋሉ፣ ግን ዲያ ለብዙ-ተናጋሪ ድጋፍ ለተደረገው ውይይት የተቀየሰ ነው። ዲያ የበለጠ ተፈጥሯዊ ውይይት በበለጠ ዙር በመውሰድ ያመጣል። ባርክ ብዙ ቋንቋዎችን ይደግፋል፣ ግን ዲያ የበለጠ የንግግር ጥራት አለው።
ዲያ ለ1.6B ፓራሜትር ሞዴሉ ከVRAM 10GB ያህል ያስፈልጋል። ለተሻለ ስራ 12GB ያህል ያለው GPU ያስፈልጋል።
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50