ቀን

Ultra

የድምፅ ክሎኒንግ እና የድምፅ ድምፆች

Medium ፍጥነት

Excellent ጥራት

አዎ መተላለፊያ

1 ቋንቋዎች

ስለ ቀን

ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from

የቁልፍ ባህሪያት

የመደቡን ቅርጸት

በተለያዩ ድምጾችና ዙር በመውሰድ ተፈጥሯዊ የብዙ-ተናጋሪ ውይይቶችን ይፈጥሩ

የድምፅ መጠን

[የሚስቅ], (የሚስቅ) ለተፈጥሮአዊ የቋንቋ መግለጫዎች ጨምር

የድምፅ ቅጂ

የድምፅ ፋይል

ምናሌ

1.6B ፓራሜትሮች በጣም ተፈጥሯዊ የንግግር ፀጉር እና ድምፅን ያመጡታል.

ጥቅም

የዳታ ፋይል የድምፅ መጽሐፍ ምርት በብዙ ፊደላት የጨዋታ ፊደል ቅርጽ የፖድካስት እና የይዘት መፍጠር

እንዴት እንደሚጠቀሙ ቀን

1

ነጻ ይመዝገቡ ወይም ዲሞን ይክፈቱ

ነጻ TextToSpeechAI ሒሳብ ለመፍጠር የመጀመርያዎቹን ክሬዲቶች ለማግኘት ወይም የዲያ ውይይቱን በፍጥነት ለመሞከር የሌለ-ምዝገባ ዲሞን ለመክፈት.
2

የዲአይኤንጂን ምርጫ

በቲቲኤስ ዳሽቦርድ ውስጥ ከኢንጂን ዝርዝር ውስጥ ዲአይአን ይምረጡ። ዲአይአን የዳያሎግ-ተኮር፣ የከፍተኛ ደረጃ ሞዴል ነው፣ በብዙ-ተናጋሪ እና በድምፅ-ክሎኒንግ ድጋፍ።
3

የዳታ ስክሪፕት

የንግግርዎን ርዕስ በ [S1] እና [S2] በመጠቀም የእያንዳንዱን ተናጋሪ ዙር ለማሳየት እና እንደ [laughs], [sighs], [coughs], ወይም (gasps) ያሉ ያልሆኑ መለያዎችን በመተው የትኛውንም ተፈጥሯዊ መልስ ይፈልጋሉ.
4

ድምፅን አስጀምር

የዲያ ስክሪፕትዎን ወደ ተቀባይ GPUs ለመላክ ያድርጉ. ዲያ የሁለት-ተናጋሪውን ውይይት በዙር-መውሰድ እና በአንድ የድምፅ ፋይል ውስጥ የእርስዎን ያልሆኑ መለያዎች ያቀርባል.
5

መተግበሪያውን ያውርዱ

የተጠናቀቀውን ማያያዣ በፈለግክበት ቅርጸት ያውርዱ፣ ወይም ተመሳሳይ [S1]/[S2] ስክሪፕት በTextToSpeechAI API ላይ በግልባጭዎ ቶኬን በመላክ አውቶማቲክ ያድርጉት።

ቀን መተግበሪያዎች

የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] ጤና ይስጥልኝ! ዛሬ እንዴት ነህ? [የሚጨነቅ] [S2] በጣም ደስተኛ ነኝ፣ ለጠየቅከኝ አመሰግናለሁ!",
    "voice": "en_US-lessac-medium"
  }'

የAPI ሰነዶች የእርስዎን API ቁልፍ ማግኘት

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

Dia ከ Nari Labs የተገኘ የ1.6B ፐራሜትር የዳያሎግ-ተኮር ጽሑፍ-ወደ-ንግግር ሞዴል ነው. ለብዙ ተናጋሪዎች፣ ለነጠላ ድምፆች፣ ለድምፅ ክሎኒንግ ድጋፍ ያለውን ተፈጥሯዊ የንግግር ንግግር በማምረት ላይ ያተኮረ ነው

አዎ, Dia በሙሉ Apache 2.0 ፈቃድ ነው - ኮድ እና ሞዴል ክብደት. በነፃ በኮሜርሲያል ፕሮግራሞች ውስጥ ሊጠቀም ይችላል.

በወቅቱ Dia አማርኛ ብቻ ይደግፋል. ሞዴሉ ለነፃ አማርኛ ቃለ ምልልስ የተሻሻለ ነው.

ዲያ ለ1.6 ቢት ፓራሜትር ሞዴሉ ከቪሬም 10 ጊባ ያህል ያስፈልጋል። ለተሻለ ስራ 12 ጊባ ያህል የጂፒዩ ያስፈልጋል። በTextToSpeechAI ላይ ሁሉም ነገር በሆስት ጂፒዩዎች ላይ ይሠራል፣ ስለዚህ የራስዎን ሃርድዌር አያስፈልግዎትም።

አዎ - የዲያ ድምፅ ማጉያ ለሚከተለው ዓላማ የተገነባ ነው፦ [S1] እና [S2] ዙሮችን በመቀየር በስክሪፕትዎ ውስጥ፣ የዲያ TTS በሁለት ተናጋሪዎች መካከል የሚደረግ ውይይት በተለያዩ ድምጾች እና እውነተኛ ዙሮችን በመውሰድ ያመጣል፣ ይህም በአንድ ተናጋሪ TTS ሞዴሎች ውስጥ ለመድረስ አስቸጋሪ ነው።

የስክሪፕትዎ መስመር ሁሉ በ [S1] ወይም [S2] የሚናገረው ማን እንደሆነ ለማሳየት ይጀምሩ. Dia ለእያንዳንዱ መለያ ትክክለኛ የሆነ ድምፅ ይሰጣል እናም ውይይቱ ሲንቀሳቀስ በመካከላቸው ይለዋወጣል ፣ ስለዚህ [S1] እና [S2] በድምጽ ማጉያዎ ውስጥ እንደ ሁለት ፊደላት ይሠራሉ ፡፡

አዎ. Dia ከ5-10 ሰከንዶች የድምፅ ክሎኒንግን ይደግፋል፣ ለተናጋሪ የተወሰነ ድምፅን መጠቀምን ያስችልዎታል። ክሎኒንግን ከ[S1]/[S2] መለያዎች ጋር ማቀናጀት ይችላሉ ስለዚህ በድምጽ ማጉያ ውስጥ ያለው ፊደል ሁሉ እንደ ክሎኒንግ ያደረጉት ድምፅ ይሰማል።

ዲያ [ስቅሶ], [አፍንጫ], [አፍንጫ], እና (አፍንጫ) እንደ ተፈጥሯዊ paralinguistic ድምፆች የተነጋገሩ ቃላትን ይልቅ ንግግር ውስጥ የተቀላቀሉ ናቸው. ትርጉም ይፈልጋሉ - ለምሳሌ "[S1] ይህ አስደሳች ነው [ስቅሶ]" - ውይይቱን የበለጠ ሰው ለማድረግ.

Dia እና Bark ሁለቱም የቃላት ያልሆኑ ድምጾችን ይደግፋሉ፣ ነገር ግን Dia ለብዙ-ተናጋሪ ውይይት [S1] / [S2] ዙር-መያዝ እና የድምፅ ክሎኒንግ ጥቅም ላይ ውሏል። Dia ለሁለቱም ሰው እውነተኛ ውይይቶች እና የፊደል ሥራዎች ይመርጡ፤ Bark በአንድ-ድምፅ ተናጋሪነት ውስጥ የበለጠ የቋንቋ ጥበቃ ያስፈልግዎት ከሆነ የበለጠ ተስማሚ ነው።

Dia የከፍተኛ ደረጃ ማሽን ነው፣ ስለዚህ ለ 1,000 የተፈጠሩ ቃላት 50 ክሬዲቶች ይከፍላል። የከፍተኛ ደረጃ ደረጃው ትልቁን 1.6B ሞዴል እና ~10GB የ GPU ሜሞሪን ለከፍተኛ ጥራት ያለው ውይይት የሚጠቀምበትን ያመለክታል።

አዎ. አዲስ TextToSpeechAI ሒሳብ ነፃ የጀማሪ ክሬዲቶች ያካትታል, እና ያለ መመዝገብ መጫን ይችላሉ ዲሞ አለ. ይህ በ [S1] / [S2] መለያዎች ጋር ጥቂት Dia ውይይት ለመፍጠር በቂ ነው በፊት የተከፈለ ዕቅድ ላይ መወሰን.

አዎ. ከሂሳብዎ ገጽ ላይ API ቶኬን ካገኙ በኋላ የዲአይአይ የድምጽ ቃለ መጠይቅ ስክሪፕቶችን - [S1] / [S2] ዙሮችን እና እንደ [laughs] ያሉ መለያዎችን ጨምሮ - ወደ TextToSpeechAI REST API ማቅረብ እና የተገኘውን ድምፅ በፕሮግራም ማውረድ ይችላሉ።

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 1
GPU VRAM 10GB
Credits/1000 chars 50

Try ቀን Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

ቀን

ስለ ቀን

የቁልፍ ባህሪያት

የመደቡን ቅርጸት

የድምፅ መጠን

የድምፅ ቅጂ

ምናሌ

ጥቅም

እንዴት እንደሚጠቀሙ ቀን

ነጻ ይመዝገቡ ወይም ዲሞን ይክፈቱ

የዲአይኤንጂን ምርጫ

የዳታ ስክሪፕት

ድምፅን አስጀምር

መተግበሪያውን ያውርዱ

ቀን መተግበሪያዎች

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ዲያ ቲቲኤስ ምንድን ነው?

ዲያ ነፃ ነው ወይስ ለኮሜርሺያል ጥቅም?

ዲያ ምን ቋንቋዎችን ይደግፋል?

የGPU ማስታወሻ Dia ምን ያህል ያስፈልጋል?

በብዙ ፊደላት መካከል ዲያ ማወያየት ይችላልን?

የዲያ ተናጋሪ መለያዎች [S1] እና [S2] እንዴት ይሠራሉ?

ዲያ ድምጾችን ይክሎናል?

እንደ [ለቅሶ] እና [ለቅሶ] ያሉ ያልሆኑ መለያዎች በዲያ እንዴት ይሰማሉ?

ዲያ VS ባርክ: የትኛውን መጠቀም አለብኝ?

ዲያ በTextToSpeechAI ላይ ምን ያህል ክሬዲት ያስከፍላል?

ዲያ ቲቲኤስ ነፃ ነው?

Dia በ TextToSpeechAI API ውስጥ መጠቀም እችላለሁ?

Technical Specs

Try ቀን Now

Other TTS Engines

ቅርጽ

ቻተርቦክስ

የድምፅ መጠን፦