કોકોરો

Standard

ઝડપી, હળવા TTS ને પ્રાકૃતિક ગુણવત્તા સાથે

Very Fast ઝડપ
Good ગુણવત્તા
નહિં ક્લોન કરી રહ્યા છે
9 ભાષાઓ

વિશે કોકોરો

82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters in the world. It is the first TTS model to support 82M parameters in the world. Kokoro supports

મુખ્ય લાક્ષણિકતાઓ

અત્યંત હળવું

82M પરિમાણો, ~300MB મોડેલ માપ. CPU પર ઓછામાં ઓછા સ્ત્રોતો સાથે ચલાવે છે.

નજીકના વાસ્તવિક સમય

પ્લેબેક ઝડપ કરતા ઝડપી બોલી બનાવે છે, GPU પ્રવેગ વિના પણ.

બહુભાષી

અંગ્રેજી, ફ્રેન્ચ, સ્પેનિશ, હિન્દી, જાપાની, ચીની, ઇટાલિયન, પોર્ટુગીઝ અને કોરીયનને આધાર આપે છે.

અવાજ મિશ્રણ

અનોખા અવાજ સંયોજનોને બનાવવા માટે બે અવાજોને એક સાથે મિક્સ કરો.

કેસ વાપરો

વાસ્તવિક સમય ચેટબોટ્સ અને વર્ચ્યુઅલ સહાયકો લખાણ-થી-ભાષાનું સ્ટ્રીમિંગ એજ ડિપ્લોયમેન્ટ અને મોબાઇલ કાર્યક્રમો ઉચ્ચ-વોલ્યુમ બેચ પ્રક્રિયા

કેવી રીતે વાપરવું કોકોરો

  1. 1

    મફત નોંધણી કરો અથવા ડેમોનો પ્રયત્ન કરો

    Create a free TextToSpeechAI account to get 200 starter credits, or use the no-signup demo to hear Kokoro instantly. The standard tier means Kokoro only costs 10 credits per 1000 characters.

  2. 2

    કોકોરો અવાજ પસંદ કરો

    અવાજ બ્રાઉઝરને ખોલો અને તમારી લક્ષ્ય ભાષામાં કોકોરો અવાજ પસંદ કરો (૯ આધારભૂત, અંગ્રેજીથી જાપાની અને કોરીયન સુધી). તમે કોકોરો અવાજ મિશ્રણને વૈવિધ્યપૂર્ણ સંયોજનમાં બે અવાજોને મિશ્રિત કરવા માટે પણ વાપરી શકો છો.

  3. 3

    તમારું લખાણ દાખલ કરો

    લખાણ લખો અથવા ચોંટાડો જે તમે સંપાદકમાં બોલવા માંગો છો. કોકોરો લાંબા પાનાઓને તેની હળવી 82M-પરિમાણી, નજીકના વાસ્તવિક સમય એન્જિનને કારણે અસરકારક રીતે સંભાળે છે.

  4. 4

    ઝડપ સુયોજિત કરો અને ઉત્પન્ન કરો

    તમારા વપરાશ કેસને અનુરૂપ પ્લેબેક ઝડપ સુયોજિત કરો, પછી ઉત્પન્ન કરો પર ક્લિક કરો. કોકોરો વાસ્તવિક સમય કરતાં ઝડપી ઓડિયો રેન્ડર કરે છે, તેથી તમારી ભાષા લગભગ તરત જ તૈયાર છે.

  5. 5

    API ડાઉનલોડ કરો અથવા વાપરો

    MP3 અથવા WAV તરીકે સમાપ્ત ઓડિયો ડાઉનલોડ કરો, અથવા TextToSpeechAI REST API દ્દારા api.texttospeechai.com પર બાચ અને વાસ્તવિક સમય કામના ભાર માટે સ્વયંજન્મ કરો.

કોકોરો API

TextToSpeechAI REST API ની મદદથી પ્રોગ્રામિક રીતે ભાષા બનાવો.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "કોકોરો અસામાન્ય ઝડપ અને કાર્યક્ષમતા સાથે પ્રાકૃતિક ભાષા રજૂ કરે છે.",
    "voice": "en_US-lessac-medium"
  }'

વારંવાર પૂછાતા પ્રશ્નો

કોકોરો એ માત્ર ૮૨ મિલિયન પરિમાણો સાથે અત્યંત-લઘુ વજનવાળા લખાણ-થી-ભાષણ મોડેલ છે. તેના નાના કદ છતાં, તે ઘણાબધા ભાષાઓ પર નજીકના વાસ્તવિક સમયની ઝડપે, CPU પર પણ, કુદરતી-સંગીત વાક્ય ઉત્પન્ન કરે છે.

હા, કોકોરો સંપૂર્ણપણે Apache ૨. ૦ લાઇસન્સ ધરાવે છે - બંને કોડ અને મોડેલ વજન. તે કોઈ પ્રતિબંધ વગર વાણિજ્યિક કાર્યક્રમોમાં મુક્તપણે વાપરી શકાય છે.

કોકોરો અંગ્રેજી (US અને બ્રિટિશ), ફ્રેન્ચ, સ્પેનિશ, હિન્દી, જાપાની, ચીની, ઇટાલિયન, પોર્ટુગીઝ અને કોરીયનને આધાર આપે છે.

કોકોરો એ ઉપલબ્ધ TTS મોડેલોમાં ઝડપી છે. તે CPU પર પણ વાસ્તવિક સમય પ્લેબેક ઝડપ કરતાં ઝડપી બોલી બનાવે છે, તેને ઇન્ટરેક્ટિવ કાર્યક્રમો માટે યોગ્ય બનાવે છે.

ના, કોકોરો અવાજ ક્લોનને આધાર આપતું નથી. તે અવાજ મિશ્રણ ક્ષમતા સાથે સંભાળાયેલ અવાજ લાઇબ્રેરી વાપરે છે. અવાજ ક્લોન માટે, F5-TTS, Chatterbox, StyleTTS2, OpenVoice, અથવા Tortoise વાપરો.

કોકોરો બે અવાજોને એક સાથે મિક્સ કરી શકે છે અને અનોખા સંયોજનો બનાવી શકે છે. આ તમને પરંપરાગત અવાજ ક્લોનિંગ વગર વૈવિધ્યપૂર્ણ અવાજ ગુણધર્મો બનાવવા માટે પરવાનગી આપે છે.

બંને ઝડપી, હળવા મોડેલો છે. કોકોરો પાસે વધુ આધુનિક આર્કિટેક્ચર છે અને અવાજ મિશ્રણને આધાર આપે છે, જ્યારે પાયપર પાસે મોટી અવાજ લાઇબ્રેરી છે. બંને વાસ્તવિક સમય કાર્યક્રમો માટે ઉત્તમ છે.

કોકોરો CPU પર ચલાવવા માટે ડિઝાઇન થયેલ છે અને ઓછામાં ઓછા સ્ત્રોતોની જરૂર છે - લગભગ ૩૦૦MB. GPU ની જરૂર નથી, જોકે GPU ઝડપી કરવા માટે પણ આધારભૂત છે.

હા. કોકોરો CPU પર પણ રમવા કરતાં બોલવાનું ઝડપી બનાવે છે, ખૂબ ઓછા લૅટેન્સી સાથે, તેથી તે વાતચીતબોટ્સ, અવાજ સહાયકો, અને જીવંત સ્ટ્રીમિંગ માટે ઉત્તમ બંધબેસે છે. તેનું 82M-પરિમાણ માપ મેમરી વપરાશને નાનું રાખે છે, તેને ઉચ્ચ-વોલ્યુમ અને બાજુ વિસ્તરણો માટે ઉપયોગી બનાવે છે.

અવાજ મિશ્રણ તમને બે Kokoro અવાજોને સાથે મિક્સ કરવા દે છે, વૈવિધ્યપૂર્ણ લક્ષણો સાથે અનોખું સંયોજન બનાવવા માટે. તે પરંપરાગત અવાજ ક્લોનિંગ નથી - તમે નમૂનામાંથી ચોક્કસ વ્યક્તિને પુનઃપ્રાપ્તિ કરી શકતા નથી - પરંતુ તે તમને ચોક્કસ અવાજ લાઇબ્રેરી કરતાં વધુ વિવિધતા આપે છે. તમે TextToSpeechAI સંપાદકમાં સીધા જ મિશ્રણો સાથે પ્રયોગ કરી શકો છો.

બંને ઝડપી, CPU-મિત્રતાપૂર્ણ પ્રમાણભૂત-સ્તર એન્જિનો છે, અવાજ ક્લોનિંગ વગર. કોકોરો સૌથી હળવું છે (300MB ની આસપાસ) અને ૯ ભાષાઓમાં અવાજ મિશ્રણને આધાર આપે છે, જ્યારે મેલોTTS ઘણાબધા અંગ્રેજી ભાષાંતરો અને વાસ્તવિક સમય બહુભાષી આઉટપુટ પર ધ્યાન કેન્દ્રિત કરે છે. સૌથી નાની ફૂટપ્રિન્ટ અને મિશ્રણ માટે કોકોરો પસંદ કરો; જ્યારે તમને ચોક્કસ ભાષાંતરોની જરૂર હોય ત્યારે મેલોTTS પસંદ કરો.

Kokoro is a standard-tier engine, costing 10 credits per 1000 characters - the lowest tier on TextToSpeechAI. New accounts get 200 free credits, so you can try Kokoro without paying. This makes it one of the most cost-effective ways to generate high-quality speech at scale.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try કોકોરો Now

Generate your first audio free. No credit card required.

Start Free