વિસ્તારો

Ultra

લાગણી અને શૈલી નિયંત્રણ સાથે વ્યક્ત કરવા માટેનો અવાજ ક્લોનિંગ

Medium ઝડપ
Excellent ગુણવત્તા
હા ક્લોન કરી રહ્યા છે
5 ભાષાઓ

વિશે વિસ્તારો

s. It is designed to be used in the

મુખ્ય લાક્ષણિકતાઓ

લાગણી નિયંત્રણ

ભાષામાં લાગણીઓ નિયંત્રિત કરો: ખુશી, દુઃખ, ગુસ્સો, ભય, અચરજ, તિરસ્કાર અને નિષ્ક્રિયતા.

અવાજ ક્લોનિંગ

ઉચ્ચ વિશ્વસનીયતા સાથે સંદર્ભ ઓડિયોનાં ૫-૩૦ સેકન્ડોમાંથી કોઇપણ અવાજ ક્લોન કરો.

વ્યક્ત કરનાર ભાષા

1.6B પરિમાણો ભાવનાત્મક રૂપે ઊંડાણપૂર્વકના સંદેશાવ્યવહાર સાથે અત્યંત વ્યક્તીગત ભાષા ઉત્પન્ન કરે છે.

બહુભાષી

અંગ્રેજી, જાપાની, ચીની, ફ્રેન્ચ અને જર્મનને આધાર આપે છે.

કેસ વાપરો

લાગણીશીલ વ્યક્તીગત સમાવિષ્ટોનું સર્જન લાગણી સાથે રમત અક્ષરોનો અવાજ મૂડ સાથે ઓડિયોબુક વાર્તાલાપ ઇન્ટરેક્ટિવ અવાજ અનુભવો

કેવી રીતે વાપરવું વિસ્તારો

  1. 1

    નોંધણી કરો અથવા ડેમો ખોલો

    શરૂઆતના ક્રેડિટ મેળવવા માટે મફત TextToSpeechAI ખાતું બનાવો, અથવા ઝોનોસને તરત જ પ્રયત્ન કરવા માટે નોંધણી વિનાનું ડેમો વાપરો.

  2. 2

    Zonos એન્જિન પસંદ કરો

    અવાજ અને મોડેલ પસંદ કરનારમાંથી Zonos ને પસંદ કરો. અવાજને ક્લોન કરવા માટે, સાફ સંદર્ભ ઓડિયોનું ૫-૩૦ સેકન્ડો અપલોડ કરો જેથી Zonos સ્પીકર સાથે બંધબેસશે.

  3. 3

    તમારું લખાણ દાખલ કરો

    તમે બોલવા માંગતા હોવ તે સ્ક્રિપ્ટને લખો અથવા ચોંટાડો. Zonos અંગ્રેજી, જાપાની, ચીની, ફ્રેન્ચ અને જર્મન વચ્ચે કામ કરે છે.

  4. 4

    લાગણી પસંદ કરો અને બનાવો

    સાત ઝોનો લાગણીઓમાંથી એક પસંદ કરો - તટસ્થ, ખુશી, દુઃખ, ગુસ્સો, ભય, અચરજ, અથવા તિરસ્કાર - પછી એ મનોરંજન માટે વ્યક્તીગત ભાષાને રજૂ કરવા માટે બનાવો પર ક્લિક કરો.

  5. 5

    API ડાઉનલોડ કરો અથવા વાપરો

    સમાપ્ત થયેલ ઓડિયો પાછો વગાડો અને ડાઉનલોડ કરો, અથવા સ્વયંકાર્ય પ્રવાહ માટે TextToSpeechAI REST API દ્દારા સમાન Zonos એન્જિનને પ્રોગ્રામિક રીતે બોલાવો.

વિસ્તારો API

TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ઝોનોસ અત્યંત સ્પષ્ટ ભાષા ઉત્પન્ન કરે છે અને તેમાં ભાવનાઓનું નિયંત્રણ છે.",
    "voice": "en_US-lessac-medium"
  }'

વારંવાર પૂછાતા પ્રશ્નો

Zonos is a 1.6B parameter text-to-speech model from Zyphra. It specializes in expressive speech generation with fine-grained emotion control and high-fidelity voice cloning. On TextToSpeechAI it runs as an ultra-tier engine for the most nuanced, emotionally rich audio.

હા. ઝોનોસ એ તેના કોડ અને મોડેલ વજન બંને માટે Apache 2.0 લાઇસન્સ હેઠળ બહાર પાડવામાં આવે છે, તેથી તે કોઈપણ અધિકાર અથવા બિન-વ્યાપારિક પ્રતિબંધો વગર વાણિજ્યિક ઉત્પાદનો માં મુક્તપણે વાપરી શકાય છે. તે ચૂકવણી થયેલ એપ્લિકેશનો, ક્લાયન્ટ કામ, અને monetized સમાવિષ્ટો માટે સુરક્ષિત બનાવે છે.

Zonos સાત લાગણીની સ્થિતિઓ રજૂ કરે છે - તટસ્થ, ખુશી, દુઃખ, ગુસ્સો, ભય, અચંબો, અને તિરસ્કાર - જે તમે ઉત્પન્ન કરતા પહેલા પસંદ કરો. મોડેલ પસંદ કરેલ લાગણી પર તેની પહોંચની શરતો, ટોન બદલી, પઝેશન, અને અવાજો પર આધારિત છે જેથી એક જ વાક્ય ખુશ અથવા ગુસ્સાવાળી રીતે સંભળાય. આ Zonos ને અક્ષર અવાજો અને સંવાદ માટે યોગ્ય બનાવે છે કે જેને ચોક્કસ મૂડની જરૂર હોય છે.

ઝોનોસ સાત લાગણી વિકલ્પોને આધાર આપે છે: તટસ્થ, ખુશી, દુઃખ, ગુસ્સો, ભય, અચરજ, અને તિરસ્કાર. તમે સમગ્ર ક્લિપના લાગણીશીલ ટોનને સુયોજિત કરવા માટે પેઢી દીઠ એક પસંદ કરો.

હા. Zonos સંદર્ભ ઓડિયોનાં ફક્ત ૫-૩૦ સેકન્ડોમાંથી અવાજ ક્લોન કરે છે, બોલનારની લાક્ષણિકતાઓ કાઢી નાખે છે અને તેમને નવી ભાષામાં પુનઃપ્રાપ્તિ કરે છે. તમે ક્લોન થયેલ અવાજને ખુશ, ગુસ્સાવાળી, અથવા ડરવાળી બનાવે છે તે માટે સાત લાગણીઓમાંથી કોઇપણ સાથે ક્લોનિંગને સંયોજિત કરી શકો છો.

Zonos પાંચ ભાષાઓ સંભાળે છે: અંગ્રેજી, જાપાની, ચીની, ફ્રેન્ચ અને જર્મન. લાગણી નિયંત્રણ અને અવાજ ક્લોનિંગ આ બધી ભાષાઓ પર કામ કરે છે.

ઝોનોસ તેની 1.6B પરિમાણ માપને કારણે મધ્યમ ઝડપે ચલાવે છે, ઉત્તમ, અત્યંત વ્યક્ત કરવા માટેના આઉટપુટ માટે કાચા થ્રુપુટને વેચી રહ્યા છે. ગુણવત્તા લાગણીશીલ અને ક્લોન થયેલ ભાષા માટે શ્રેષ્ઠ છે, તેથી તે મોટા પ્રમાણમાં વાસ્તવિક સમય ઉત્પન્ન કરતા અંતિમ ઉત્પાદન ઓડિયો માટે યોગ્ય છે.

Zonos ને તેની 1.6B પરિમાણ મોડેલ માટે VRAM ની 8GB અથવા વધુની જરૂર છે. GPU ઓછામાં ઓછા 10GB સાથે સુવિધાયુક્ત કાર્ય માટે સૂચવાયેલ છે જ્યારે ભાવના નિયંત્રણ સાથે અવાજ ક્લોનિંગને સંયોજિત કરે છે. TextToSpeechAI પર આ બધુ અમારા GPU બેકએન્ડ પર ચાલે છે, તેથી તમારે તમારા પોતાના હાર્ડવેર ની જરૂર નથી.

ઝોનોસ અલ્ટ્રા-ટીયર એન્જિન છે, ૧,૦૦૦ અક્ષરો માટે ૫૦ ક્રેડિટ પર બિલ કરેલ છે. અલ્ટ્રા-ટીયર તેના મોટા મોડેલ અને અદ્યતન લાગણી અને ક્લોનિંગ ક્ષમતાઓને પ્રતિબિંબિત કરે છે, StyleTTS2, Tortoise, અને OpenVoice જેવી જ સ્તરની.

બંને શૈલી અને ભાવના નિયંત્રણ અવાજ ક્લોનિંગ સાથે આપે છે. ઝોનોસ સાત અલગ ભાવના સ્થિતિઓ અને આધુનિક 1.6B આર્કિટેક્ચર પૂરુ પાડે છે, જ્યારે ઓપનવોઇસ ખૂબ ઝડપી તરત જ ક્લોનિંગ સાથે મિત્રતાપૂર્ણ, ખુશખુશાલ, અને વીસપેરિંગ જેવી ટોન શૈલીઓ પૂરુ પાડે છે. જ્યારે તમે સ્પષ્ટ ભાવના પસંદગી અને મહત્તમ વ્યક્તીત્વ ઇચ્છો ત્યારે ઝોનોસ પસંદ કરો; હળવા, ઝડપી ટોન બદલવા માટે ઓપનવોઇસ પસંદ કરો.

બાર્ક [હસવું] અને [સહજ] જેવા વ્યક્તીગત નિશાનીઓ ઉમેરે છે પરંતુ મર્યાદિત ક્લોનિંગ પ્રદાન કરે છે, અને ડાયા અવાચક ધ્વનિઓ સાથે બહુ-સ્પીકર સંવાદ પર ધ્યાન કેન્દ્રિત કરે છે. ઝોનોસ સ્પષ્ટ લાગણી પસંદગી ઉપર કેન્દ્રિત છે અને મજબૂત એકલા-અવાજ ક્લોનિંગ, તમને દરેક ક્લિપના મૂડ પર ચોક્કસ નિયંત્રણ આપે છે. જો તમને લાગણી ટેગની જરૂર હોય તો એંજીન પસંદ કરો કે જે બંધબેસે છે, સંવાદ ફેરફારો, અથવા પસંદગીની લાગણીઓ.

હા. નવા TextToSpeechAI ખાતાઓ મુક્ત શરૂઆત ક્રેડિટ મેળવે છે, અને ડેમો તમને નોંધણી વગર નમૂના ઓડિયો ઉત્પન્ન કરવા દે છે. વધારાના ક્રેડિટ ખરીદતા પહેલા Zonos લાગણી નિયંત્રણ અને અવાજ ક્લોનિંગ ચકાસવા માટે પૂરતી છે.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try વિસ્તારો Now

Generate your first audio free. No credit card required.

Start Free