ስለ የድምፅ መጠን፦
CosyVoice2 is a next-generation speech synthesis model from FunAudioLLM (Alibaba). It delivers natural-sounding zero-shot voice cloning across multiple languages with streaming capability for low-latency applications. Built on a finite scalar quantization approach, it achieves excellent voice similarity with just a few seconds of reference audio.
የቁልፍ ባህሪያት
የድምፅ ቅጂ
ከ3-10 ሰከንዶች የመዝገብ ቤት ድምፅ በከፍተኛ ፍጥነት ክሎን
ብዙ ቋንቋዎች
ቻይንኛ, እንግሊዝኛ, ጃፓንኛ, ኮሪያኛ, እና የካቶንጎ ቋንቋዎች ጋር ተቀላቅሏል.
የቀጥታ ድጋፍ
ለጊዜው ፕሮግራሞችና ለተገናኝ ስርዓቶች ዝቅተኛ-ለታክሲው-የሚፈስ አማራጭ
የቋንቋ ችሎታ
የቀደመ ፕሮሶዲ ሞዴሊንግ በተመጣጣኝ ድምፅ የተፈጥሮ-ድምፅ ንግግርን ያመነጫል።
ጥቅም
እንዴት እንደሚጠቀሙ የድምፅ መጠን፦
-
1
ምዝገባ እና ነፃ ክሬዲቶች መጠየቅ
ነጻ TextToSpeechAI ሒሳብን ለመፍጠር ወይም መጀመሪያ ዲሞን ለመሞከር ይሞክሩ. ምንም ጂፒዩ ወይም የኮሲቮይሲ2 ማውረድ ያስፈልጋል - ሁሉም ነገር በመሰረተ ልማት ላይ ይሠራል.
-
2
የኮስሚ ድምፅ2ን ይምረጡና የመዝገብ ቤትን ቪዲዮ ጨምሩ
የኮሲቪዥን2ን እንደ መሳሪያህ ይምረጡ፣ ከዚያም 3-10 ሰከንዶች የሚቆይ የድምፅ ማስረጃ መዝገብ ቤትን ከፍ አድርግ። ኮሲቪዥን2 የዜናውን ባህሪያት ለዝቅተኛ-አስማት የብዙ ቋንቋ ክሎኒንግ ያወጣል
-
3
የጽሑፍዎን በየትኛውም የተደገፈ ቋንቋ ያስገቡ
ቻይንኛ, አማርኛ, ጃፓንኛ, ኮሪያኛ, ወይም ካቶንጎኛ ውስጥ በትክክል ወይም በትክክል
-
4
የንግግር ፋይል
መተግበሪያውን በመጫን ተጨማሪ ቋንቋዎችን በመፍጠር ላይ ይጫኑ።CosyVoice2ም በጥቂት ሰከንዶች ውስጥ በጥቁር ደብዳቤዎች ውስጥ በጥቁር ደብዳቤዎች ውስጥ ተፈጥሯዊ፣ ብዙ ቋንቋዎችን የሚናገሩ ቃላትን ያቀላጥፋል።የፕሪሚየም ደረጃው ጥቅም በ1,000 አርእስቶች 25 ክሬዲት ያስከፍላል።
-
5
መተግበሪያውን ይጫኑ
የመጨረሻውን ድምፅ ከታሪክዎ እንደ MP3 ወይም WAV ያውርዱ፣ ወይም በ TextToSpeechAI REST API በኩል የኮሲቮይሲ2 ድምፅ ክሎኒንግን በከፍተኛ መጠን አውቶማቲክ ያድርጉ።
የድምፅ መጠን፦ መተግበሪያዎች
የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "የኮሲቪዥን2 ድምፅ ሙሉ በሙሉ የማይታወቅ የድምፅ ችሎታ ያለው ሲሆን በብዙ ቋንቋዎች የሚናገሩትን ድምፅ ያቀርባል።",
"voice": "en_US-lessac-medium"
}'
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25