કોસીવૉઇસ૨
Premiumસ્ટ્રીમિંગ આધાર સાથે ઝીરો-શૉટ બહુભાષી અવાજ ક્લોનીંગ
વિશે કોસીવૉઇસ૨
-to-voice cloning across multiple languages with streaming capability for low-latency voice cloning. CosyVoice2 is the first speech synthesis model to be built with the
મુખ્ય લાક્ષણિકતાઓ
ઝીરો-શોટ અવાજ ક્લોનીંગ
ઉચ્ચ વિશ્વસનીયતા સાથે સંદર્ભ ઓડિયોનાં ૩-૧૦ સેકન્ડોમાંથી કોઇપણ અવાજ ક્લોન કરો.
બહુભાષી
ચાઇનીઝ, અંગ્રેજી, જાપાનીઝ, કોરીઅન અને કનટન ક્રોસ-ભાષા સંયોજન સાથે આધાર આપે છે.
સ્ટ્રીમિંગ આધાર
વાસ્તવિક સમય કાર્યક્રમો અને ઇન્ટરેક્ટિવ સિસ્ટમો માટે નીચું-લેટન્સી સ્ટ્રીમિંગ સ્થિતિ.
કુદરતી પ્રોસોડી
અદ્યતન પ્રોસોડી મોડેલિંગ યોગ્ય અવાજો સાથે કુદરતી રીતે સંભળાતા ભાષણનું ઉત્પાદન કરે છે.
કેસ વાપરો
કેવી રીતે વાપરવું કોસીવૉઇસ૨
-
1
નોંધણી કરો અને મુક્ત ક્રેડિટ્સની માંગણી કરો
તમારા શરૂઆતના ક્રેડિટની માંગણી કરવા માટે મફત TextToSpeechAI ખાતું બનાવો, અથવા પહેલા ડેમોનો પ્રયત્ન કરો. કોઈ GPU અથવા સ્થાનિક CosyVoice2 સ્થાપન જરૂરી નથી - બધું અમારા ઇન્ફ્રાસ્ટ્રક્ચર પર ચાલે છે.
-
2
CosyVoice2 પસંદ કરો અને સંદર્ભ ક્લિપને ઉમેરો
તમારા એન્જિન તરીકે CosyVoice2 પસંદ કરો, પછી તમે ક્લોન કરવા માંગતા હોવ તે અવાજના સાફ ૩-૧૦ સેકન્ડ સંદર્ભ રેકોર્ડને અપલોડ કરો. CosyVoice2 શૂન્ય-શૉટ બહુભાષી ક્લોનિંગ માટે બોલક ગુણધર્મો કાઢી કાઢશે.
-
3
કોઇપણ આધારભૂત ભાષામાં તમારુ લખાણ દાખલ કરો
ચાઇનીઝ, અંગ્રેજી, જાપાનીઝ, કોરીયન, અથવા કનટોનન્ટોમાં તમારી સ્ક્રિપ્ટને લખો અથવા ચોંટાડો. CosyVoice2 ક્રોસ-ભાષા સંયોજનને આધાર આપે છે, તેથી ક્લોન થયેલ અવાજ સંદર્ભ ક્લિપથી અલગ ભાષા બોલી શકે છે.
-
4
ભાષણને બનાવો
ક્લિક બનાવો અને CosyVoice2 ક્લોન થયેલ અવાજમાં કુદરતી, બહુભાષી ભાષા સંયોજિત કરે છે, સામાન્ય રીતે ટૂંકા લખાણ માટે સેકન્ડોમાં. પ્રીમિયમ-સ્તર વપરાશ ૧,૦૦૦ અક્ષરો માટે ૨૫ ક્રેડિટ્સ ખર્ચ કરે છે.
-
5
API ડાઉનલોડ કરો અથવા વાપરો
MP3 અથવા WAV તરીકે સમાપ્ત ઓડિયો તમારા ઇતિહાસમાંથી ડાઉનલોડ કરો, અથવા TextToSpeechAI REST API દ્દારા સ્તરે CosyVoice2 અવાજ ક્લોનિંગને આપોઆપ કરો.
કોસીવૉઇસ૨ API
TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 શૂન્ય\u002Dશૂટ અવાજ ક્લોનિંગ ક્ષમતા સાથે કુદરતી બહુભાષી ભાષા પૂરી પાડે છે.",
"voice": "en_US-lessac-medium"
}'
વારંવાર પૂછાતા પ્રશ્નો
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25