ቀን

Ultra

የድምፅ ክሎኒንግ እና የድምፅ ድምፆች

Medium ፍጥነት
Excellent ጥራት
አዎ መተላለፊያ
1 ቋንቋዎች

ስለ ቀን

ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from

የቁልፍ ባህሪያት

የመደቡን ቅርጸት

በተለያዩ ድምጾችና ዙር በመውሰድ ተፈጥሯዊ የብዙ-ተናጋሪ ውይይቶችን ይፈጥሩ

የድምፅ መጠን

[የሚስቅ], (የሚስቅ) ለተፈጥሮአዊ የቋንቋ መግለጫዎች ጨምር

የድምፅ ቅጂ

የድምፅ ፋይል

ምናሌ

1.6B ፓራሜትሮች በጣም ተፈጥሯዊ የንግግር ፀጉር እና ድምፅን ያመጡታል.

ጥቅም

የዳታ ፋይል የድምፅ መጽሐፍ ምርት በብዙ ፊደላት የጨዋታ ፊደል ቅርጽ የፖድካስት እና የይዘት መፍጠር

እንዴት እንደሚጠቀሙ ቀን

  1. 1

    ነጻ ይመዝገቡ ወይም ዲሞን ይክፈቱ

    ነጻ TextToSpeechAI ሒሳብ ለመፍጠር የመጀመርያዎቹን ክሬዲቶች ለማግኘት ወይም የዲያ ውይይቱን በፍጥነት ለመሞከር የሌለ-ምዝገባ ዲሞን ለመክፈት.

  2. 2

    የዲአይኤንጂን ምርጫ

    በቲቲኤስ ዳሽቦርድ ውስጥ ከኢንጂን ዝርዝር ውስጥ ዲአይአን ይምረጡ። ዲአይአን የዳያሎግ-ተኮር፣ የከፍተኛ ደረጃ ሞዴል ነው፣ በብዙ-ተናጋሪ እና በድምፅ-ክሎኒንግ ድጋፍ።

  3. 3

    የዳታ ስክሪፕት

    የንግግርዎን ርዕስ በ [S1] እና [S2] በመጠቀም የእያንዳንዱን ተናጋሪ ዙር ለማሳየት እና እንደ [laughs], [sighs], [coughs], ወይም (gasps) ያሉ ያልሆኑ መለያዎችን በመተው የትኛውንም ተፈጥሯዊ መልስ ይፈልጋሉ.

  4. 4

    ድምፅን አስጀምር

    የዲያ ስክሪፕትዎን ወደ ተቀባይ GPUs ለመላክ ያድርጉ. ዲያ የሁለት-ተናጋሪውን ውይይት በዙር-መውሰድ እና በአንድ የድምፅ ፋይል ውስጥ የእርስዎን ያልሆኑ መለያዎች ያቀርባል.

  5. 5

    መተግበሪያውን ያውርዱ

    የተጠናቀቀውን ማያያዣ በፈለግክበት ቅርጸት ያውርዱ፣ ወይም ተመሳሳይ [S1]/[S2] ስክሪፕት በTextToSpeechAI API ላይ በግልባጭዎ ቶኬን በመላክ አውቶማቲክ ያድርጉት።

ቀን መተግበሪያዎች

የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] ጤና ይስጥልኝ! ዛሬ እንዴት ነህ? [የሚጨነቅ] [S2] በጣም ደስተኛ ነኝ፣ ለጠየቅከኝ አመሰግናለሁ!",
    "voice": "en_US-lessac-medium"
  }'

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

Dia ከ Nari Labs የተገኘ የ1.6B ፐራሜትር የዳያሎግ-ተኮር ጽሑፍ-ወደ-ንግግር ሞዴል ነው. ለብዙ ተናጋሪዎች፣ ለነጠላ ድምፆች፣ ለድምፅ ክሎኒንግ ድጋፍ ያለውን ተፈጥሯዊ የንግግር ንግግር በማምረት ላይ ያተኮረ ነው

አዎ, Dia በሙሉ Apache 2.0 ፈቃድ ነው - ኮድ እና ሞዴል ክብደት. በነፃ በኮሜርሲያል ፕሮግራሞች ውስጥ ሊጠቀም ይችላል.

በወቅቱ Dia አማርኛ ብቻ ይደግፋል. ሞዴሉ ለነፃ አማርኛ ቃለ ምልልስ የተሻሻለ ነው.

ዲያ ለ1.6 ቢት ፓራሜትር ሞዴሉ ከቪሬም 10 ጊባ ያህል ያስፈልጋል። ለተሻለ ስራ 12 ጊባ ያህል የጂፒዩ ያስፈልጋል። በTextToSpeechAI ላይ ሁሉም ነገር በሆስት ጂፒዩዎች ላይ ይሠራል፣ ስለዚህ የራስዎን ሃርድዌር አያስፈልግዎትም።

አዎ - የዲያ ድምፅ ማጉያ ለሚከተለው ዓላማ የተገነባ ነው፦ [S1] እና [S2] ዙሮችን በመቀየር በስክሪፕትዎ ውስጥ፣ የዲያ TTS በሁለት ተናጋሪዎች መካከል የሚደረግ ውይይት በተለያዩ ድምጾች እና እውነተኛ ዙሮችን በመውሰድ ያመጣል፣ ይህም በአንድ ተናጋሪ TTS ሞዴሎች ውስጥ ለመድረስ አስቸጋሪ ነው።

የስክሪፕትዎ መስመር ሁሉ በ [S1] ወይም [S2] የሚናገረው ማን እንደሆነ ለማሳየት ይጀምሩ. Dia ለእያንዳንዱ መለያ ትክክለኛ የሆነ ድምፅ ይሰጣል እናም ውይይቱ ሲንቀሳቀስ በመካከላቸው ይለዋወጣል ፣ ስለዚህ [S1] እና [S2] በድምጽ ማጉያዎ ውስጥ እንደ ሁለት ፊደላት ይሠራሉ ፡፡

አዎ. Dia ከ5-10 ሰከንዶች የድምፅ ክሎኒንግን ይደግፋል፣ ለተናጋሪ የተወሰነ ድምፅን መጠቀምን ያስችልዎታል። ክሎኒንግን ከ[S1]/[S2] መለያዎች ጋር ማቀናጀት ይችላሉ ስለዚህ በድምጽ ማጉያ ውስጥ ያለው ፊደል ሁሉ እንደ ክሎኒንግ ያደረጉት ድምፅ ይሰማል።

ዲያ [ስቅሶ], [አፍንጫ], [አፍንጫ], እና (አፍንጫ) እንደ ተፈጥሯዊ paralinguistic ድምፆች የተነጋገሩ ቃላትን ይልቅ ንግግር ውስጥ የተቀላቀሉ ናቸው. ትርጉም ይፈልጋሉ - ለምሳሌ "[S1] ይህ አስደሳች ነው [ስቅሶ]" - ውይይቱን የበለጠ ሰው ለማድረግ.

Dia እና Bark ሁለቱም የቃላት ያልሆኑ ድምጾችን ይደግፋሉ፣ ነገር ግን Dia ለብዙ-ተናጋሪ ውይይት [S1] / [S2] ዙር-መያዝ እና የድምፅ ክሎኒንግ ጥቅም ላይ ውሏል። Dia ለሁለቱም ሰው እውነተኛ ውይይቶች እና የፊደል ሥራዎች ይመርጡ፤ Bark በአንድ-ድምፅ ተናጋሪነት ውስጥ የበለጠ የቋንቋ ጥበቃ ያስፈልግዎት ከሆነ የበለጠ ተስማሚ ነው።

Dia የከፍተኛ ደረጃ ማሽን ነው፣ ስለዚህ ለ 1,000 የተፈጠሩ ቃላት 50 ክሬዲቶች ይከፍላል። የከፍተኛ ደረጃ ደረጃው ትልቁን 1.6B ሞዴል እና ~10GB የ GPU ሜሞሪን ለከፍተኛ ጥራት ያለው ውይይት የሚጠቀምበትን ያመለክታል።

አዎ. አዲስ TextToSpeechAI ሒሳብ ነፃ የጀማሪ ክሬዲቶች ያካትታል, እና ያለ መመዝገብ መጫን ይችላሉ ዲሞ አለ. ይህ በ [S1] / [S2] መለያዎች ጋር ጥቂት Dia ውይይት ለመፍጠር በቂ ነው በፊት የተከፈለ ዕቅድ ላይ መወሰን.

አዎ. ከሂሳብዎ ገጽ ላይ API ቶኬን ካገኙ በኋላ የዲአይአይ የድምጽ ቃለ መጠይቅ ስክሪፕቶችን - [S1] / [S2] ዙሮችን እና እንደ [laughs] ያሉ መለያዎችን ጨምሮ - ወደ TextToSpeechAI REST API ማቅረብ እና የተገኘውን ድምፅ በፕሮግራም ማውረድ ይችላሉ።

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try ቀን Now

Generate your first audio free. No credit card required.

Start Free