ઓપનવોઇસ

Ultra

ગ્રેનોલાર ટોન નિયંત્રણ સાથે તરત જ અવાજ ક્લોનિંગ

Moderate ઝડપ
Very Good ગુણવત્તા
હા ક્લોન કરી રહ્યા છે
10 ભાષાઓ

વિશે ઓપનવોઇસ

of the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the

મુખ્ય લાક્ષણિકતાઓ

તરત જ ક્લોનિંગ

ઓડિયોનાં થોડા સેકન્ડોમાંથી કોઇપણ અવાજને ક્લોન કરો.

ટોન નિયંત્રણ

ખુશ, દુઃખી, ગુસ્સે, ઉત્તેજિત, અથવા ફૂંફાડા મારતા ટોન લાગુ કરો.

શૈલી પરિવહન

લવચીકતા માટે બોલવાની શૈલીમાંથી અવાજ ઓળખને અલગ કરો.

ક્રોસ-લિંગુઅલ

વિવિધ ભાષાઓ પર ક્લોન થયેલ અવાજોને વાપરો.

ઝડપી પ્રક્રિયા

ઝડપી અવાજ ઉત્પન્ન કરવા માટે અસરકારક અનુમાન.

ઓપન સોર્સ

વાણિજ્યિક કાર્યક્રમો માટે MIT લાઇસન્સ.

કેસ વાપરો

લાગણીશીલ સમાવિષ્ટો અક્ષર એનિમેશન ઇન્ટરેક્ટિવ રમતો ઓડિયોબુક વાર્તાલાપ માર્કેટિંગ વિડિઓઝ વર્ચ્યુઅલ સહાયકો

કેવી રીતે વાપરવું ઓપનવોઇસ

  1. 1

    મફત નોંધણી કરો અથવા ડેમોનો પ્રયત્ન કરો

    શરૂઆતના ક્રેડિટ મેળવવા માટે મફત TextToSpeechAI ખાતું બનાવો, અથવા ઓપનવોઇસ સાંભળવા માટે ઓન-પૃષ્ઠ ડેમોનો ઉપયોગ કરો. કોઈ સ્થાનિક GPU અથવા સ્થાપન જરૂરી નથી - બધું આપણા સર્વર પર ચાલે છે.

  2. 2

    OpenVoice પસંદ કરો અને સંદર્ભ ક્લિપને અપલોડ કરો

    OpenVoice એન્જિન પસંદ કરો, પછી લક્ષ્ય અવાજને તરત જ ક્લોન કરવા માટે સાફ સંદર્ભ ઓડિયોનાં થોડી સેકન્ડો અપલોડ કરો. OpenVoice બોલનાર ઓળખને ઝડપી લે છે જેથી તમે તેને કોઈપણ લખાણ અને ટોન પર ફરીથી વાપરી શકો.

  3. 3

    તમારું લખાણ દાખલ કરો

    તમે ક્લોન થયેલ અવાજમાં બોલવા માંગતા હોવ તે સ્ક્રિપ્ટને લખો અથવા ચોંટાડો. OpenVoice આશરે ૧૦ ભાષાઓ અને ક્રોસ-ભાષા પૂરી પાડવાનું આધાર આપે છે, તેથી તમે સંદર્ભ ક્લિપ કરતાં અલગ ભાષામાં લખી શકો છો.

  4. 4

    ટોન શૈલી પસંદ કરો અને બનાવો

    OpenVoice ટોન શૈલીઓમાંથી એક પસંદ કરો - મૂળભૂત, મિત્રતાપૂર્ણ, ખુશખુશાલ, ઉત્તેજિત, દુઃખી, ગુસ્સે થયેલ, ભયભીત, ચીસ પાડતી, અથવા ફૂંફાં મારતી - પછી ઉત્પન્ન કરો. સમાન ક્લોન થયેલ અવાજ એ લાગણીશીલ પ્રદાન સાથે બોલશે.

  5. 5

    API ડાઉનલોડ કરો અથવા વાપરો

    તમારા ઓડિયોને MP3, WAV, અથવા OGG તરીકે ડાઉનલોડ કરો, અથવા TextToSpeechAI API દ્દારા તમારો ક્લોન થયેલ અવાજ અને ટોન શૈલી દરેક વિનંતી માં પાસ કરીને આપોઆપ ઉત્પન્ન કરો.

ઓપનવોઇસ API

TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice કોઈપણ ટોન \u002D ખુશ, દુઃખી, અથવા ફરીથી ફરીથી બોલી શકે છે.",
    "voice": "en_US-lessac-medium"
  }'

વારંવાર પૂછાતા પ્રશ્નો

OpenVoice એ ઉચ્ચ લખાણ-થી-ભાષા અને અવાજ ક્લોન મોડેલ છે કે જે બોલવાની શૈલીમાંથી અવાજ ઓળખને અલગ પાડે છે. આ તમને અવાજ ક્લોન કરવા દે છે અને પછી દરેક લાગણી માટે નવા સંદર્ભ ઓડિયોની જરૂર વગર અલગ લાગણીશીલ ટોન લાગુ કરે છે. તે વ્યક્ત કરવા માટે બનાવવામાં આવેલ છે, નિયંત્રિત બોલી ઉત્પન્ન કરે છે.

હા, OpenVoice સંદર્ભ ઓડિયોનાં થોડા સેકન્ડોથી તરત જ અવાજ ક્લોનિંગ કરે છે - કોઈ તાલીમ ચલાવવાની જરૂર નથી. એકવાર અવાજને ઝડપી લેવામાં આવે છે, OpenVoice કોઈપણ લખાણ અને તમે પસંદ કરેલ કોઈપણ ટોન શૈલી પર તે ઓળખને ફરીથી વાપરી શકે છે.

OpenVoice બે-સ્તર આર્કિટેક્ચર વાપરે છે જે ટોન પરિવર્તનમાંથી આધારભૂત ભાષા સંયોજનને વિભાજિત કરે છે. અવાજ ક્લોન કર્યા પછી, તમે9ટોન શૈલીઓમાંથી કોઈપણને લાગુ કરી શકો છો - મૂળભૂત, મિત્રતાપૂર્ણ, ખુશખુશાલ, ઉત્તેજિત, દુઃખી, ગુસ્સે, ડરાયેલ, ચીસ પાડતા, અથવા ફરીથી રેકોર્ડ કર્યા વિના તમારા પસંદ કરેલ ટોન પર આધારિત અલગ બોલે છે.

OpenVoice નવી બોલવાની શૈલીઓ આધાર આપે છે: મૂળભૂત, મિત્રતાપૂર્ણ, ખુશખુશાલ, ઉત્સાહિત, દુઃખી, ગુસ્સે થયેલ, ડરાયેલ, બૂમ પાડતી, અને ચીસ પાડતી. દરેક શૈલી કલ્પિત બોલનાર ઓળખને સંગ્રહતી વખતે લાગણીશીલ પૂરી પાડવાનું પુનઃરૂપરેખાંકિત કરે છે, તમને લીટી કેવી રીતે વાંચવામાં આવે છે તેના પર ફાઇન-ગ્રેન નિયંત્રણ આપતી.

OpenVoice એ MIT લાઇસન્સ હેઠળ ઓપન-સોર્સ છે, તેથી તે વાણિજ્યિક વપરાશ માટે મુક્ત છે. કોઈપણ ક્લોનિંગ મોડેલ સાથે, ખાતરી કરો કે તમારી પાસે કોઈપણ અવાજ માટે યોગ્ય અધિકારો છે જે તમે વાણિજ્યિક પ્રોજેક્ટ્સ માટે ક્લોન કરો છો.

OpenVoice અંગ્રેજ, ચીની, જાપાની, કોરીયન, અને ઘણાં યુરોપિયન ભાષાઓ સહિત આશરે 10 ભાષાઓને આધાર આપે છે. તે ક્રોસ-ભાષા ક્લોનીંગ પણ આપે છે, તેથી તમે એક ભાષામાં અવાજ ક્લોન કરી શકો છો અને તેને બીજી ભાષામાં કુદરતી રીતે બોલાવો.

OpenVoice ની મધ્યમ ઉત્પન્ન ઝડપ છે, સામાન્ય રીતે GPU પર ૨-૪ સેકન્ડોમાં વાક્યને રેન્ડર કરે છે. આઉટપુટ ગુણવત્તા ખૂબ સારી છે, સ્પષ્ટ અવાજ પુનરાવર્તન અને ટોન પરિવહન સાથે જે બોલનાર ઓળખને અદૃશ્ય રાખે છે જ્યારે લાગણીશીલ પૂરી પાડવામાં વિશ્વાસપાત્ર રીતે બદલે છે.

OpenVoice સામાન્ય રીતે VRAM ની 6-8GB જરૂરી છે જે બેચ માપ અને ટોન પરિવર્તન ભાર પર આધારિત છે. તે મધ્ય-રેન્જથી ઉપરના મધ્ય-રેન્જ GPUs પર આરામથી ચલાવે છે, અને TextToSpeechAI પર આ બધું અમારા સર્વર પર સંભાળવામાં આવે છે તેથી તમારે કોઈ સ્થાનિક હાર્ડવેરની જરૂર નથી.

OpenVoice એ અલ્ટ્રા-ટીયર એન્જિન છે, ૧૦૦૦ અક્ષરો માટે ૫૦ ક્રેડિટ પર કિંમત. અલ્ટ્રા-ટીયર એ તેના ઉચ્ચ ટોન નિયંત્રણ અને ક્લોનિંગ માટે જરૂરી વધારાના કોમ્પ્યુટ અને શૈલી-રૂપાંતરણ પાઇપલાઇનને પ્રતિબિંબિત કરે છે.

OpenVoice તેના ટોન અને શૈલી નિયંત્રણ માટે અનોખું છે: તમે એક ક્લોન થયેલ અવાજ લઈ શકો છો અને તેને ખુશ, દુઃખી, ગુસ્સે થયેલ, અથવા ફરીથી ફૂંક મારતી તરીકે પૂરો પાડી શકો છો. F5-TTS ઝડપી છે અને કુદરતી, તટસ્થ બોલવા માટે અમારું મૂળભૂત ક્લોનિંગ એન્જિન છે. OpenVoice પસંદ કરો જ્યારે તમારે લાગણીશીલ શૈલી નિયંત્રણની જરૂર હોય, અને F5-TTS જ્યારે તમે ઝડપી કુદરતી ક્લોન ઇચ્છો.

સંદર્ભ ઓડિયો અપલોડ કરીને ક્લોન થયેલ અવાજ બનાવો, પછી તમારી API વિનંતી માં ટોન શૈલી સ્પષ્ટ કરો. API ક્લોન થયેલ અવાજ માં આપોઆપ તમારો પસંદ કરેલ લાગણીશીલ ટોન લાગુ કરે છે અને MP3, WAV, અથવા OGG બંધારણમાં ઓડિયો પાછો આપે છે.

હા. શરૂઆતના ક્રેડિટ મેળવવા માટે મુક્ત TextToSpeechAI ખાતા માટે નોંધણી કરો અને OpenVoice ક્લોનિંગ અને ટોન નિયંત્રણનો પ્રયત્ન કરો, અથવા પ્રથમ પર-પૃષ્ઠ ડેમો વાપરો. ત્યાં કોઈ સ્થાનિક સુયોજન નથી - સંદર્ભ ક્લિપ અપલોડ કરો, ટોન પસંદ કરો, અને બ્રાઉઝરમાં ઉત્પન્ન કરો.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try ઓપનવોઇસ Now

Generate your first audio free. No credit card required.

Start Free