દિવસ

Ultra

સંવાદ-આધારિત TTS માં અવાજ ક્લોનિંગ અને અવાચક ધ્વનિઓ

મુક્ત પ્રયત્ન કરો દિવસ અવાજોને બ્રાઉઝ કરો (0)

Medium ઝડપ

Excellent ગુણવત્તા

હા ક્લોન કરી રહ્યા છે

1 ભાષાઓ

વિશે દિવસ

ing the ability to generate dialogues from 1000-1500 characters, and is capable of generating 1000-2000 characters per second. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is based on the 1.6B parameter text-to-speech model. Dia is the first text-to-speech model to use this model,

મુખ્ય લાક્ષણિકતાઓ

સંવાદ ઉત્પન્ન કરો

અલગ અવાજો અને બદલાતી રીતમાં કુદરતી બહુ-સ્પીકર વાર્તાલાપ બનાવો.

અવાચક અવાજો

કુદરતી ભાષાકીય વ્યક્તીત્વ માટે [હસવું], [સૂઈ જવું], [ખાંસી], (ગાંઠો) ઉમેરો.

અવાજ ક્લોનિંગ

વ્યક્તિગત ભાષા માટે સંદર્ભ ઓડિયોનાં ૫-૧૦ સેકન્ડોમાંથી કોઇપણ અવાજની ક્લોન કરો.

કુદરતી સંવાદ

1.6B પરિમાણો ખૂબ જ કુદરતી વાતચીત પ્રોસોડી અને ઇનટોનેશન ઉત્પન્ન કરે છે.

કેસ વાપરો

સંવાદ અને વાતચીત ઉત્પન્ન કરો ઘણાબધા અક્ષરો સાથે ઓડિયોબુક ઉત્પાદન રમત અક્ષર ધ્વનિઓ પોડકાસ્ટ અને સમાવિષ્ટોનું સર્જન

કેવી રીતે વાપરવું દિવસ

1

મફત નોંધણી કરો અથવા ડેમો ખોલો

તમારા શરૂઆતના ક્રેડિટ્સની માંગણી કરવા માટે મફત TextToSpeechAI ખાતું બનાવો, અથવા Dia સંવાદને તરત જ પ્રયત્ન કરવા માટે નોંધણી વિનાનું ડેમો ખોલો.
2

Dia એન્જિન પસંદ કરો

TTS ડેશબોર્ડમાં એન્જિન યાદીમાંથી Dia પસંદ કરો. Dia એ સંવાદ-આધારિત, અલ્ટ્રા-ટાઇર મોડેલ છે અને તેમાં ઘણાબધા સ્પીકર અને અવાજ-ક્લોનિંગ આધાર છે.
3

ટેગો સાથે સંવાદ સ્ક્રિપ્ટ લખો

દરેક બોલનારની ફરજને ચિહ્નિત કરવા માટે [S1] અને [S2] ની મદદથી તમારો વાર્તાલાપ બનાવો, અને [લગ્ઝ], [સિગ્ઝ], [કોકસ], અથવા (ગાસપ્સ) જેવા અવાચક ટેગ્સ મૂકો જ્યાં તમે કુદરતી પ્રતિક્રિયાઓ ઇચ્છો.
4

ઓડિયો બનાવો

તમારી Dia સ્ક્રિપ્ટને અમારા યજમાન GPUs ને મોકલવા માટે બનાવો પર ક્લિક કરો. Dia એક ઓડિયો ફાઈલમાં બદલો લેવાની સાથે અને તમારા અવાચક ટેગો સાથે બે સ્પીકર સંવાદને રેન્ડર કરે છે.
5

API ને ડાઉનલોડ કરો અથવા બોલાવો

તમારા પસંદ કરેલ બંધારણમાં સમાપ્ત સંવાદને ડાઉનલોડ કરો, અથવા તમારા ખાતા ટોકન સાથે TextToSpeechAI API માં સમાન [S1]/[S2] સ્ક્રિપ્ટને પોસ્ટ કરીને તેને આપોઆપ કરો.

દિવસ API

TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] હલો! આજે તમે કેવા છો? [હસવા માંડે છે] [S2] હું સારું કરી રહ્યો છું, પૂછવા બદલ આભાર!",
    "voice": "en_US-lessac-medium"
  }'

API દસ્તાવેજો વાંચો તમારી API કી મેળવો

વારંવાર પૂછાતા પ્રશ્નો

Dia એ Nari Labs માંથી 1.6B પરિમાણ સંવાદ-આધારિત લખાણ-થી-ભાષા મોડેલ છે. તે ઘણાબધા બોલકો, અવાચક ધ્વનિઓ, અને અવાજ ક્લોનીંગ માટે આધાર સાથે કુદરતી સંવાદાત્મક ભાષાને ઉત્પન્ન કરવામાં વિશેષ છે.

હા, Dia એ સંપૂર્ણપણે Apache ૨. ૦ લાઇસન્સ ધરાવે છે - બંને કોડ અને મોડેલ વજન. તે વાણિજ્યિક કાર્યક્રમોમાં મુક્તપણે વાપરી શકાય છે.

Dia હાલમાં ફક્ત અંગ્રેજી આધાર આપે છે. મોડેલને પ્રાકૃતિક અંગ્રેજી સંવાદ વાક્ય માટે સુધારેલ છે.

Dia એ તેની 1.6B પરિમાણ મોડેલ માટે VRAM ની લગભગ 10GB જરૂરી છે. ઓછામાં ઓછા 12GB સાથે GPU એ સુવિધાજનક કાર્ય માટે સૂચવાયેલ છે. TextToSpeechAI પર આ બધુ અમારા યજમાન GPUs પર ચાલે છે, તેથી તમારે તમારા પોતાના કોઈપણ હાર્ડવેરની જરૂર નથી.

હા - સંવાદ એ Dia માટે બરાબર બનાવેલ છે. તમારી સ્ક્રિપ્ટમાં [S1] અને [S2] ફેરફારો બદલીને, Dia TTS વિશિષ્ટ અવાજો અને વાસ્તવિક ફેરફારો સાથે વહેતી બે-સ્પીકર વાતચીત બનાવે છે, જે એક-સ્પીકર TTS મોડેલો સાથે મેળવવા માટે મુશ્કેલ છે.

તમારી સ્ક્રિપ્ટની દરેક લીટીને [S1] અથવા [S2] સાથે પૂર્વગ કરો કે જેથી કોણ બોલી રહ્યું છે તે ચિહ્નિત કરી શકાય. Dia દરેક ટેગને સંતુલિત અવાજ સોંપે છે અને તેમની વચ્ચે બદલે છે જેમ વાતચીત ખસેડે છે, તેથી [S1] અને [S2] તમારા સંવાદમાં બે અક્ષરો તરીકે વર્તશે.

હા. Dia એ સાફ સંદર્ભ ઓડિયોનાં લગભગ ૫-૧૦ સેકન્ડોથી અવાજ ક્લોનિંગને આધાર આપે છે, તમને સ્પીકર માટે ચોક્કસ અવાજનો પુનઃઉપયોગ કરવા દે છે. તમે [S1]/[S2] ટેગો સાથે ક્લોનિંગને સંયોજિત કરી શકો છો જેથી સંવાદમાં દરેક અક્ષર તમે ક્લોન કરેલ અવાજની જેમ સંભળાય.

Dia [હસવું], [સૂસવાટ], [ખાંસી], અને (ગાંઠ) ને બોલાયેલ શબ્દોની જગ્યાએ વાક્યમાં વણાયેલા કુદરતી પૅરાલિંગ્વીસ્ટિક અવાજો તરીકે રજૂ કરે છે. તમે જ્યાં પ્રતિક્રિયા ઇચ્છો ત્યાં ટેગ મૂકો - ઉદાહરણ તરીકે "[S1] આ હાસ્યજનક છે [હસવું]" - સંવાદને વધુ માનવીય બનાવે છે.

Dia અને Bark બંને અવાચીન અવાજોને આધાર આપે છે, પરંતુ Dia [S1]/[S2] ક્રમ લેવા અને અવાજ ક્લોનિંગ સાથે બહુ-સ્પીકર સંવાદ માટે હેતુ-બનાવેલ છે. વાસ્તવિક બે-વ્યક્તિ સંવાદ અને અક્ષર કામ માટે Dia પસંદ કરો; Bark એ વધુ સારી રીતે બંધબેસે છે જ્યારે તમને એક-અવાજ વાર્તાલાપમાં વિસ્તૃત ભાષા આવરણની જરૂર હોય.

Dia એ અલ્ટ્રા-ટીયર એન્જિન છે, તેથી તે જનરેટ થયેલ ભાષાના ૧,૦૦૦ અક્ષરો માટે ૫૦ ક્રેડિટ્સનો ખર્ચ કરે છે. અલ્ટ્રા-ટીયર મોટું ૧.૬B મોડેલ અને ~૧૦GB GPU મેમરી પ્રતિબિંબિત કરે છે જે તે ઉચ્ચ ગુણવત્તાવાળા સંવાદ માટે વાપરે છે.

હા. નવા TextToSpeechAI ખાતાઓ મુક્ત શરૂઆત ક્રેડિટ્સ સમાવે છે, અને ત્યાં ડેમો છે કે તમે નોંધણી કર્યા વિના ચલાવી શકો છો. તે ચૂકવણી યોજના પર નિર્ણય લેવા પહેલાં [S1]/[S2] ટેગો સાથે ટૂંકો Dia સંવાદ બનાવવા માટે પૂરતો છે.

હા. એકવાર તમારી પાસે તમારા ખાતા પાનામાંથી API ટોકન હોય ત્યારે તમે Dia સંવાદ સ્ક્રિપ્ટ્સને રજૂ કરી શકો છો - [S1]/[S2] ટોન અને [laughs] જેવી ટેગ્સને સમાવતા - TextToSpeechAI REST API ને અને પરિણામી ઓડિયો પ્રોગ્રામિક રીતે ડાઉનલોડ કરો.

Technical Specs

Generation Speed Medium
Output Quality Excellent
Voice Cloning Supported
Languages 1
GPU VRAM 10GB
Credits/1000 chars 50

Try દિવસ Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

દિવસ

વિશે દિવસ

મુખ્ય લાક્ષણિકતાઓ

સંવાદ ઉત્પન્ન કરો

અવાચક અવાજો

અવાજ ક્લોનિંગ

કુદરતી સંવાદ

કેસ વાપરો

કેવી રીતે વાપરવું દિવસ

મફત નોંધણી કરો અથવા ડેમો ખોલો

Dia એન્જિન પસંદ કરો

ટેગો સાથે સંવાદ સ્ક્રિપ્ટ લખો

ઓડિયો બનાવો

API ને ડાઉનલોડ કરો અથવા બોલાવો

દિવસ API

વારંવાર પૂછાતા પ્રશ્નો

Dia TTS શું છે?

શું ડાયા વેપારિક રીતે ઉપયોગ કરવા માટે મુક્ત છે?

કઈ ભાષાઓ Dia આધાર આપે છે?

Dia ને કેટલી GPU મેમરી જરૂરી છે?

શું Dia એ ઘણાં અક્ષરો વચ્ચે સંવાદ પેદા કરી શકે છે?

Dia સ્પીકર ટેગ [S1] અને [S2] કેવી રીતે કામ કરે છે?

શું Dia એ અવાજોને ક્લોન કરે છે?

[laughs] અને [sighs] જેવા અવાચક ટેગ્સ Dia માં કેવી રીતે સંભળાય છે?

Dia vs Bark: હું કયો વાપરવો જોઇએ?

TextToSpeechAI પર Dia કેટલી ક્રેડિટ્સનો ખર્ચ કરે છે?

શું હું Dia TTS ને મફત માટે પ્રયત્ન કરી શકું?

શું હું TextToSpeechAI API દ્દારા Dia વાપરી શકું?

Technical Specs

Try દિવસ Now

Other TTS Engines

પાંદડો

ચેટબોક્સ

કોસીવૉઇસ૨