የድምፅ መጠን፦

Premium

0-shot የብዙ ቋንቋዎች የድምፅ ክሎኒንግ

Fast ፍጥነት
Very Good ጥራት
አዎ መተላለፊያ
5 ቋንቋዎች

ስለ የድምፅ መጠን፦

CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.

የቁልፍ ባህሪያት

የድምፅ ቅጂ

ከ3-10 ሰከንዶች የመዝገብ ቤት ድምፅ በከፍተኛ ፍጥነት ክሎን

ብዙ ቋንቋዎች

ቻይንኛ, እንግሊዝኛ, ጃፓንኛ, ኮሪያኛ, እና የካቶንጎ ቋንቋዎች ጋር ተቀላቅሏል.

የቀጥታ ድጋፍ

ለጊዜው ፕሮግራሞችና ለተገናኝ ስርዓቶች ዝቅተኛ-ለታክሲው-የሚፈስ አማራጭ

የቋንቋ ችሎታ

የቀደመ ፕሮሶዲ ሞዴሊንግ በተመጣጣኝ ድምፅ የተፈጥሮ-ድምፅ ንግግርን ያመነጫል።

ጥቅም

የብዙ ቋንቋዎች ይዘት መፍጠር የድምፅ ረዳቶች ቋንቋ የድምፅ ፕሮግራሞች

እንዴት እንደሚጠቀሙ የድምፅ መጠን፦

  1. 1

    ምዝገባ እና ነፃ ክሬዲቶች መጠየቅ

    ነጻ TextToSpeechAI ሒሳብን ለመፍጠር ወይም መጀመሪያ ዲሞን ለመሞከር ይሞክሩ. ምንም ጂፒዩ ወይም የኮሲቮይሲ2 ማውረድ ያስፈልጋል - ሁሉም ነገር በመሰረተ ልማት ላይ ይሠራል.

  2. 2

    የኮስሚ ድምፅ2ን ይምረጡና የመዝገብ ቤትን ቪዲዮ ጨምሩ

    የኮሲቪዥን2ን እንደ መሳሪያህ ይምረጡ፣ ከዚያም 3-10 ሰከንዶች የሚቆይ የድምፅ ማስረጃ መዝገብ ቤትን ከፍ አድርግ። ኮሲቪዥን2 የዜናውን ባህሪያት ለዝቅተኛ-አስማት የብዙ ቋንቋ ክሎኒንግ ያወጣል

  3. 3

    የጽሑፍዎን በየትኛውም የተደገፈ ቋንቋ ያስገቡ

    ቻይንኛ, አማርኛ, ጃፓንኛ, ኮሪያኛ, ወይም ካቶንጎኛ ውስጥ በትክክል ወይም በትክክል

  4. 4

    የንግግር ፋይል

    መተግበሪያውን በመጫን ተጨማሪ ቋንቋዎችን በመፍጠር ላይ ይጫኑ።CosyVoice2ም በጥቂት ሰከንዶች ውስጥ በጥቁር ደብዳቤዎች ውስጥ በጥቁር ደብዳቤዎች ውስጥ ተፈጥሯዊ፣ ብዙ ቋንቋዎችን የሚናገሩ ቃላትን ያቀላጥፋል።የፕሪሚየም ደረጃው ጥቅም በ1,000 አርእስቶች 25 ክሬዲት ያስከፍላል።

  5. 5

    መተግበሪያውን ይጫኑ

    የመጨረሻውን ድምፅ ከታሪክዎ እንደ MP3 ወይም WAV ያውርዱ፣ ወይም በ TextToSpeechAI REST API በኩል የኮሲቮይሲ2 ድምፅ ክሎኒንግን በከፍተኛ መጠን አውቶማቲክ ያድርጉ።

የድምፅ መጠን፦ መተግበሪያዎች

የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "የኮሲቪዥን2 ድምፅ ሙሉ በሙሉ የማይታወቅ የድምፅ ችሎታ ያለው ሲሆን በብዙ ቋንቋዎች የሚናገሩትን ድምፅ ያቀርባል።",
    "voice": "en_US-lessac-medium"
  }'

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ኮሲቮይሲ2 ከ ፉንኦዲዮኤልኤል (አሊባባ) የመጣ የወደፊቱ ትውልድ የጽሑፍ-ወደ-ንግግር እና የድምፅ ክሎኒንግ ሞዴል ነው. ከጥቂት ሰከንዶች የድምፅ መዝገብ ቤት ጀምሮ የድምፅ ክሎኒንግን ይደግፋል እንዲሁም በቻይንኛ፣ አማርኛ፣ ጃፓንኛ፣ ኮሪያኛ እና ካቶንጎኛ ውስጥ ተፈጥሯዊ ንግግርን ማቀናጀት ይችላል። በ TextToSpeechAI ላይ ኮሲቮይሲ2ን በድር አሳሽ ውስጥ ያለ ምንም የክልል ማዘጋጀት መሥራት ይችላሉ።

አዎ, CosyVoice2 በሙሉ Apache 2.0 ፈቃድ ነው - ኮድ እና ሞዴል ክብደት. ይህ በኮሜርሲያል ምርቶች, የተከፈለ ይዘት, እና የክላይንት ሥራ ያለ ፈቃድ ክፍያዎች ወይም ያልሆኑ የኮሜርሲያል መቀነስ መጠቀም ደህንነቱ የተጠበቀ ያደርገዋል.

የኮሲ ድምፅ 2 አምስት ቋንቋዎችን ይደግፋል: ቻይንኛ (ማንዳሪን), አማርኛ, ጃፓንኛ, ኮሪያኛ, እና ካቶንጎ. ይህም cross-language ስብስብ ይይዛል, ስለዚህ በአንድ ቋንቋ መዝገብ ቤት ውስጥ ድምፅ ክሎን እና ንግግር በሌላ ውስጥ ማምረት ይችላሉ.

3-10 ሰከንዶች የመጨረሻው የድምፅ አዳሚ ንጹህ መዝገብ ቤት ድምፅ ይሰጣል. CosyVoice2 የድምፅ አዳሚ ባህሪያትን በፍጻሜው ስካላር ኩዌንቲንግ ዘዴ በመጠቀም ያወጣል፣ ከዚያም በተቀናጀው ድምፅ ውስጥ በየትኛውም ቋንቋዎች ላይ አዲስ ንግግር ይፈጥራል. ምንም ዓይነት ስልጠና ወይም ጥሩ ማስተካከያ ያስፈልጋል

የኮሲድምፅ2 ከብዙ ቋንቋዎች የክሎኒንግ ሞዴሎች አንዱ ነው፣ ከማሳያ ክሊፕ የተለየ ቋንቋን ሲፈጥሩም የተናጋሪውን ማንነት የሚጠብቅ ነው። ይህም ተፈጥሯዊ የድምፅ ቅርፅ እና ድምፅን ያመጣል፣ ይህም ለተለያዩ ቋንቋዎች የሚተረጎም እና የተቀመጠው ይዘት ተስማሚ ያደርገዋል ፡፡

አዎ. ኮሲቮይሲ2 ፈጣን ሞዴል ሲሆን ለድምፅ ረዳቶች እና ለተግባራዊ ፕሮግራሞች ተስማሚ የሆነ ዝቅተኛ ላቴንሲ ያለው ድምፅ የሚያመነጭ የስትሪም ሞድ ይዟል። በ TextToSpeechAI ትውልዶች ለጥቂት ጽሑፍ በሴኮንዶች ውስጥ ይሟላል።

የኮሲቪኦይሲ2 ለ0.5ቢ ማራሚተር ሞዴል 4-6GB VRAM ያስፈልጋል፣ ስለዚህ 6GB ወይም ከዚያ በላይ ያለው GPU በራሱ ሲስተም ሲሰሩ ጠቃሚ ነው። በTextToSpeechAI ላይ ሞዴሉ በGPU ኢንፍራሬድ ላይ ይሠራል፣ ስለዚህ የራስዎን ማንኛውንም ሃርድዌር አያስፈልግዎትም።

CosiVoice2 የፕሪሚየም ደረጃ ሞዴል ነው እና 25 ተቀማጭ ለ 1,000 የጽሑፍ አሃዞች ዋጋ. አዲስ ሁሉ መለያ ነፃ starter ተቀማጭ ያገኛል, ስለዚህ CosiVoice2 የድምፅ ክሎኒንግ ላይ የተከፈለ ዕቅድ ላይ ከመወሰንዎ በፊት ሊሞክሩ ይችላሉ.

ሁለቱም የድምፅ ክሎኒንግ ኤንጂኖች ናቸው። GPT-SoVITS ብዙውን ጊዜ ለአንድ ዓላማ ድምፅ ከፍተኛውን የቀድሞ ተመሳሳይነት ያገኛል ፣ ግን CosyVoice2 ለብዙ ቋንቋዎች እና ለተለያዩ ቋንቋዎች ክሎኒንግ የበለጠ ኃይለኛ ነው ፣ እና ዝቅተኛ-ለተወሰነ ጊዜ የሚሰራውን መተግበሪያ ይጨምራል ፡፡ ብዙ ቋንቋዎችን ለመናገር አንድ ክሎኒንግ ድምፅ ያስፈልግዎት ከሆነ CosyVoice2 ን ይምረጡ።

ሁለቱም ከፍተኛ ጥራት ያለው zero-shot የድምፅ ክሎኒንግ ይሰጣሉ. CosyVoice2 የበለጠ ቋንቋዎችን (5 versus 2) ይደግፋል እና ለጊዜው ጥቅም ላይ የዋለ ስትሪሚንግን ይጨምራል ፣ F5-TTS ግን በእንግሊዝኛ ብቻ ለሚሠሩ ስራዎች ትንሽ ፈጣን ሊሆን ይችላል ፡፡ ለብዙ ቋንቋዎች ፕሮጀክቶች CosyVoice2 በብዛት የተሻለ ነው ፡፡

TextToSpeechAI በኮሲቮይሲ2 ትውልዶች በMP3 እና WAV ያሉ የተለመዱ ቅርጸቶች ውስጥ ማውጣት ይቻላል. ፋይሉን ከታሪክ ገጽዎ ቀጥሎ ያውርዱት ወይም በፕሮግራም በኩል ከTextToSpeechAI API ማግኘት ይችላሉ።

አዎ. የኮሲቮይሲ2ን በነፃ ዲሞ እና በነፃ የመጀመርያዎቹን ክሬዲቶች በ TextToSpeechAI ላይ ምንም ሳያስገቡ ማሞቅ ይችላሉ። ምዝገባ ብቻ፣ ጥቂት የመዝገብ ቪዲዮዎችን መላክ፣ ጽሑፍዎን በየትኛውም የተደገፈ ቋንቋ መጻፍ እና ማምረት ይችላሉ።

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try የድምፅ መጠን፦ Now

Generate your first audio free. No credit card required.

Start Free