દિવસ
Ultraસંવાદ-આધારિત TTS માં અવાજ ક્લોનિંગ અને અવાચક ધ્વનિઓ
વિશે દિવસ
ing the ability to generate dialogues from 1000-1500 characters, and is capable of generating 1000-2000 characters per second. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is based on the 1.6B parameter text-to-speech model. Dia is the first text-to-speech model to use this model,
મુખ્ય લાક્ષણિકતાઓ
સંવાદ ઉત્પન્ન કરો
અલગ અવાજો અને બદલાતી રીતમાં કુદરતી બહુ-સ્પીકર વાર્તાલાપ બનાવો.
અવાચક અવાજો
કુદરતી ભાષાકીય વ્યક્તીત્વ માટે [હસવું], [સૂઈ જવું], [ખાંસી], (ગાંઠો) ઉમેરો.
અવાજ ક્લોનિંગ
વ્યક્તિગત ભાષા માટે સંદર્ભ ઓડિયોનાં ૫-૧૦ સેકન્ડોમાંથી કોઇપણ અવાજની ક્લોન કરો.
કુદરતી સંવાદ
1.6B પરિમાણો ખૂબ જ કુદરતી વાતચીત પ્રોસોડી અને ઇનટોનેશન ઉત્પન્ન કરે છે.
કેસ વાપરો
કેવી રીતે વાપરવું દિવસ
-
1
મફત નોંધણી કરો અથવા ડેમો ખોલો
તમારા શરૂઆતના ક્રેડિટ્સની માંગણી કરવા માટે મફત TextToSpeechAI ખાતું બનાવો, અથવા Dia સંવાદને તરત જ પ્રયત્ન કરવા માટે નોંધણી વિનાનું ડેમો ખોલો.
-
2
Dia એન્જિન પસંદ કરો
TTS ડેશબોર્ડમાં એન્જિન યાદીમાંથી Dia પસંદ કરો. Dia એ સંવાદ-આધારિત, અલ્ટ્રા-ટાઇર મોડેલ છે અને તેમાં ઘણાબધા સ્પીકર અને અવાજ-ક્લોનિંગ આધાર છે.
-
3
ટેગો સાથે સંવાદ સ્ક્રિપ્ટ લખો
દરેક બોલનારની ફરજને ચિહ્નિત કરવા માટે [S1] અને [S2] ની મદદથી તમારો વાર્તાલાપ બનાવો, અને [લગ્ઝ], [સિગ્ઝ], [કોકસ], અથવા (ગાસપ્સ) જેવા અવાચક ટેગ્સ મૂકો જ્યાં તમે કુદરતી પ્રતિક્રિયાઓ ઇચ્છો.
-
4
ઓડિયો બનાવો
તમારી Dia સ્ક્રિપ્ટને અમારા યજમાન GPUs ને મોકલવા માટે બનાવો પર ક્લિક કરો. Dia એક ઓડિયો ફાઈલમાં બદલો લેવાની સાથે અને તમારા અવાચક ટેગો સાથે બે સ્પીકર સંવાદને રેન્ડર કરે છે.
-
5
API ને ડાઉનલોડ કરો અથવા બોલાવો
તમારા પસંદ કરેલ બંધારણમાં સમાપ્ત સંવાદને ડાઉનલોડ કરો, અથવા તમારા ખાતા ટોકન સાથે TextToSpeechAI API માં સમાન [S1]/[S2] સ્ક્રિપ્ટને પોસ્ટ કરીને તેને આપોઆપ કરો.
દિવસ API
TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] હલો! આજે તમે કેવા છો? [હસવા માંડે છે] [S2] હું સારું કરી રહ્યો છું, પૂછવા બદલ આભાર!",
"voice": "en_US-lessac-medium"
}'
વારંવાર પૂછાતા પ્રશ્નો
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50