દિવસ

Ultra

સંવાદ-આધારિત TTS માં અવાજ ક્લોનિંગ અને અવાચક ધ્વનિઓ

Medium ઝડપ
Excellent ગુણવત્તા
હા ક્લોન કરી રહ્યા છે
1 ભાષાઓ

વિશે દિવસ

ing the ability to generate dialogues from 1000-1500 characters, and is capable of generating 1000-2000 characters per second. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is based on the 1.6B parameter text-to-speech model. Dia is the first text-to-speech model to use this model,

મુખ્ય લાક્ષણિકતાઓ

સંવાદ ઉત્પન્ન કરો

અલગ અવાજો અને બદલાતી રીતમાં કુદરતી બહુ-સ્પીકર વાર્તાલાપ બનાવો.

અવાચક અવાજો

કુદરતી ભાષાકીય વ્યક્તીત્વ માટે [હસવું], [સૂઈ જવું], [ખાંસી], (ગાંઠો) ઉમેરો.

અવાજ ક્લોનિંગ

વ્યક્તિગત ભાષા માટે સંદર્ભ ઓડિયોનાં ૫-૧૦ સેકન્ડોમાંથી કોઇપણ અવાજની ક્લોન કરો.

કુદરતી સંવાદ

1.6B પરિમાણો ખૂબ જ કુદરતી વાતચીત પ્રોસોડી અને ઇનટોનેશન ઉત્પન્ન કરે છે.

કેસ વાપરો

સંવાદ અને વાતચીત ઉત્પન્ન કરો ઘણાબધા અક્ષરો સાથે ઓડિયોબુક ઉત્પાદન રમત અક્ષર ધ્વનિઓ પોડકાસ્ટ અને સમાવિષ્ટોનું સર્જન

કેવી રીતે વાપરવું દિવસ

  1. 1

    મફત નોંધણી કરો અથવા ડેમો ખોલો

    તમારા શરૂઆતના ક્રેડિટ્સની માંગણી કરવા માટે મફત TextToSpeechAI ખાતું બનાવો, અથવા Dia સંવાદને તરત જ પ્રયત્ન કરવા માટે નોંધણી વિનાનું ડેમો ખોલો.

  2. 2

    Dia એન્જિન પસંદ કરો

    TTS ડેશબોર્ડમાં એન્જિન યાદીમાંથી Dia પસંદ કરો. Dia એ સંવાદ-આધારિત, અલ્ટ્રા-ટાઇર મોડેલ છે અને તેમાં ઘણાબધા સ્પીકર અને અવાજ-ક્લોનિંગ આધાર છે.

  3. 3

    ટેગો સાથે સંવાદ સ્ક્રિપ્ટ લખો

    દરેક બોલનારની ફરજને ચિહ્નિત કરવા માટે [S1] અને [S2] ની મદદથી તમારો વાર્તાલાપ બનાવો, અને [લગ્ઝ], [સિગ્ઝ], [કોકસ], અથવા (ગાસપ્સ) જેવા અવાચક ટેગ્સ મૂકો જ્યાં તમે કુદરતી પ્રતિક્રિયાઓ ઇચ્છો.

  4. 4

    ઓડિયો બનાવો

    તમારી Dia સ્ક્રિપ્ટને અમારા યજમાન GPUs ને મોકલવા માટે બનાવો પર ક્લિક કરો. Dia એક ઓડિયો ફાઈલમાં બદલો લેવાની સાથે અને તમારા અવાચક ટેગો સાથે બે સ્પીકર સંવાદને રેન્ડર કરે છે.

  5. 5

    API ને ડાઉનલોડ કરો અથવા બોલાવો

    તમારા પસંદ કરેલ બંધારણમાં સમાપ્ત સંવાદને ડાઉનલોડ કરો, અથવા તમારા ખાતા ટોકન સાથે TextToSpeechAI API માં સમાન [S1]/[S2] સ્ક્રિપ્ટને પોસ્ટ કરીને તેને આપોઆપ કરો.

દિવસ API

TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] હલો! આજે તમે કેવા છો? [હસવા માંડે છે] [S2] હું સારું કરી રહ્યો છું, પૂછવા બદલ આભાર!",
    "voice": "en_US-lessac-medium"
  }'

વારંવાર પૂછાતા પ્રશ્નો

Dia એ Nari Labs માંથી 1.6B પરિમાણ સંવાદ-આધારિત લખાણ-થી-ભાષા મોડેલ છે. તે ઘણાબધા બોલકો, અવાચક ધ્વનિઓ, અને અવાજ ક્લોનીંગ માટે આધાર સાથે કુદરતી સંવાદાત્મક ભાષાને ઉત્પન્ન કરવામાં વિશેષ છે.

હા, Dia એ સંપૂર્ણપણે Apache ૨. ૦ લાઇસન્સ ધરાવે છે - બંને કોડ અને મોડેલ વજન. તે વાણિજ્યિક કાર્યક્રમોમાં મુક્તપણે વાપરી શકાય છે.

Dia હાલમાં ફક્ત અંગ્રેજી આધાર આપે છે. મોડેલને પ્રાકૃતિક અંગ્રેજી સંવાદ વાક્ય માટે સુધારેલ છે.

Dia એ તેની 1.6B પરિમાણ મોડેલ માટે VRAM ની લગભગ 10GB જરૂરી છે. ઓછામાં ઓછા 12GB સાથે GPU એ સુવિધાજનક કાર્ય માટે સૂચવાયેલ છે. TextToSpeechAI પર આ બધુ અમારા યજમાન GPUs પર ચાલે છે, તેથી તમારે તમારા પોતાના કોઈપણ હાર્ડવેરની જરૂર નથી.

હા - સંવાદ એ Dia માટે બરાબર બનાવેલ છે. તમારી સ્ક્રિપ્ટમાં [S1] અને [S2] ફેરફારો બદલીને, Dia TTS વિશિષ્ટ અવાજો અને વાસ્તવિક ફેરફારો સાથે વહેતી બે-સ્પીકર વાતચીત બનાવે છે, જે એક-સ્પીકર TTS મોડેલો સાથે મેળવવા માટે મુશ્કેલ છે.

તમારી સ્ક્રિપ્ટની દરેક લીટીને [S1] અથવા [S2] સાથે પૂર્વગ કરો કે જેથી કોણ બોલી રહ્યું છે તે ચિહ્નિત કરી શકાય. Dia દરેક ટેગને સંતુલિત અવાજ સોંપે છે અને તેમની વચ્ચે બદલે છે જેમ વાતચીત ખસેડે છે, તેથી [S1] અને [S2] તમારા સંવાદમાં બે અક્ષરો તરીકે વર્તશે.

હા. Dia એ સાફ સંદર્ભ ઓડિયોનાં લગભગ ૫-૧૦ સેકન્ડોથી અવાજ ક્લોનિંગને આધાર આપે છે, તમને સ્પીકર માટે ચોક્કસ અવાજનો પુનઃઉપયોગ કરવા દે છે. તમે [S1]/[S2] ટેગો સાથે ક્લોનિંગને સંયોજિત કરી શકો છો જેથી સંવાદમાં દરેક અક્ષર તમે ક્લોન કરેલ અવાજની જેમ સંભળાય.

Dia [હસવું], [સૂસવાટ], [ખાંસી], અને (ગાંઠ) ને બોલાયેલ શબ્દોની જગ્યાએ વાક્યમાં વણાયેલા કુદરતી પૅરાલિંગ્વીસ્ટિક અવાજો તરીકે રજૂ કરે છે. તમે જ્યાં પ્રતિક્રિયા ઇચ્છો ત્યાં ટેગ મૂકો - ઉદાહરણ તરીકે "[S1] આ હાસ્યજનક છે [હસવું]" - સંવાદને વધુ માનવીય બનાવે છે.

Dia અને Bark બંને અવાચીન અવાજોને આધાર આપે છે, પરંતુ Dia [S1]/[S2] ક્રમ લેવા અને અવાજ ક્લોનિંગ સાથે બહુ-સ્પીકર સંવાદ માટે હેતુ-બનાવેલ છે. વાસ્તવિક બે-વ્યક્તિ સંવાદ અને અક્ષર કામ માટે Dia પસંદ કરો; Bark એ વધુ સારી રીતે બંધબેસે છે જ્યારે તમને એક-અવાજ વાર્તાલાપમાં વિસ્તૃત ભાષા આવરણની જરૂર હોય.

Dia એ અલ્ટ્રા-ટીયર એન્જિન છે, તેથી તે જનરેટ થયેલ ભાષાના ૧,૦૦૦ અક્ષરો માટે ૫૦ ક્રેડિટ્સનો ખર્ચ કરે છે. અલ્ટ્રા-ટીયર મોટું ૧.૬B મોડેલ અને ~૧૦GB GPU મેમરી પ્રતિબિંબિત કરે છે જે તે ઉચ્ચ ગુણવત્તાવાળા સંવાદ માટે વાપરે છે.

હા. નવા TextToSpeechAI ખાતાઓ મુક્ત શરૂઆત ક્રેડિટ્સ સમાવે છે, અને ત્યાં ડેમો છે કે તમે નોંધણી કર્યા વિના ચલાવી શકો છો. તે ચૂકવણી યોજના પર નિર્ણય લેવા પહેલાં [S1]/[S2] ટેગો સાથે ટૂંકો Dia સંવાદ બનાવવા માટે પૂરતો છે.

હા. એકવાર તમારી પાસે તમારા ખાતા પાનામાંથી API ટોકન હોય ત્યારે તમે Dia સંવાદ સ્ક્રિપ્ટ્સને રજૂ કરી શકો છો - [S1]/[S2] ટોન અને [laughs] જેવી ટેગ્સને સમાવતા - TextToSpeechAI REST API ને અને પરિણામી ઓડિયો પ્રોગ્રામિક રીતે ડાઉનલોડ કરો.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try દિવસ Now

Generate your first audio free. No credit card required.

Start Free