ኮኮሮ

Standard

የጨረቃ-ፍጥነት, ቀላል TTS ጋር ተፈጥሯዊ ጥራት

Very Fast ፍጥነት
Good ጥራት
አዎ መተላለፊያ
9 ቋንቋዎች

ስለ ኮኮሮ

Kokoro is an ultra-lightweight 82M parameter TTS model that delivers natural-sounding speech at incredible speed. It runs near real-time even on CPU, making it ideal for applications where low latency is critical. Kokoro supports multiple languages and offers voice blending capabilities.

የቁልፍ ባህሪያት

ቀላል

82M ፐራሜትሮች, ~300MB ሞዴል መጠን. በ CPU ላይ በትንሽ መሳሪያዎች ላይ ይሠራል.

ቀጥ ያለ ጊዜ

የGPU ማገገሚያ ሳይኖርም ከማጫወት ፍጥነት ይልቅ ተናጋሪን በፍጥነት ያመነጫል።

ቋንቋ

እንግሊዝኛ፣ ፈረንሳይኛ፣ ስፓኒሽ፣ ሃንዲሽ፣ ጃፓንኛ፣ ቻይንኛ፣ ጣሊያንኛ፣ ፖርቱጋሊኛ፣ ኮሪያኛን ይደግፋል

የድምፅ ማቀነባበሪያ

ሁለት ድምጾችን በአንድ ላይ አጣምሩ የድምፅ ቅንጥቦችን ለመፍጠር

ጥቅም

የጊዜ-እውነተኛ ቻትቦቶች እና ምናባዊ ረዳቶች የቀጥታ የድምጽ መተላለፊያ የ Edge መጫን እና የሞባይል ፕሮግራሞች የከፍተኛ መጠን ስብስብ ማቀናጀት

እንዴት እንደሚጠቀሙ ኮኮሮ

  1. 1

    ነጻ ምዝገባ ወይም ዲሞን ይሞክሩ

    200 የመጀመርያ ክሬዲቶችን ለማግኘት ነፃ የ TextToSpeechAI ምዝገባን ይፍጠሩ፣ ወይም ኮኮሮን በፍጥነት ለመስማት የሌለ-ምዝገባ ዲሞን ይጠቀሙ። የስታንዳርድ ደረጃ ማለት ኮኮሮ በ 1000 አንቀጾች 10 ክሬዲቶችን ብቻ ያስከፍላል ማለት ነው ፡፡

  2. 2

    የኮኮሮ ድምፅ ይምረጡ

    የድምፅ መቃኛን ይክፈቱና በሚፈለገው ቋንቋ ኮኮሮን ድምፅ (9 የሚደገፉ፣ ከአንግሊዝኛ ጀምሮ ወደ ጃፓንኛና ኮሪያኛ) ይምረጡ። ሁለት ድምጾችን ወደ የተለየ ቅንጅት ለመቀላቀል ኮኮሮን ድምፅ ማቀላቀልንም መጠቀም ይችላሉ።

  3. 3

    ጽሑፉን አስገባ

    ፈልገህ የምትፈልገውን ጽሑፍ በምረጫው ውስጥ ጻፍ ወይም አስቀምጥ። ኮኮሮ ረዥም ክፍሎችን በጥሩ ሁኔታ ይይዛል ፣ በጥሩ ሁኔታ 82M-parameter ፣ በቅርብ ጊዜ ማሽንን ይጠቀማል ፡፡

  4. 4

    የፍጥነት ማስተካከያ እና መፍጠር

    የድምፅ ፍጥነትን ለመጫን ይምረጡ፣ ከዚያም ሰርቨር ላይ ጠቅ ያድርጉ። ኮኮሮ ድምፅን ከጊዜው ይልቅ ፈጣን ያደርገዋል፣ ስለዚህ ንግግሩ በፍጥነት ይዘጋጃል

  5. 5

    መተግበሪያውን ይጫኑ

    የጨረሰውን ድምፅ እንደ MP3 ወይም WAV ያውርዱ፣ ወይም በ TextToSpeechAI REST API በ api.texttospeechai.com ለባች እና ለጊዜው ሥራዎች ራስ-ሰር ማምረት ይችላሉ።

ኮኮሮ መተግበሪያዎች

የTextToSpeechAI REST APIን በመጠቀም ፕሮግራማዊ ንግግርን ይፈጥሩ

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ኮኮሮ በፍጥነትና በጥራት ልዩ የሆነ የቋንቋ ችሎታ አለው፡፡",
    "voice": "en_US-lessac-medium"
  }'

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ኮኮሮ 82 ሚሊዮን ፓራሜትሮች ብቻ ያለው ቀላል የጽሑፍ-ወደ-ንግግር ሞዴል ነው. በትንሹ መጠን ላይ እንኳ በብዙ ቋንቋዎች ላይ በቅርብ ጊዜ ፍጥነት በሲፒዩ ላይም ቢሆን ተፈጥሯዊ የሆነ ንግግርን ያመጣል.

አዎ, ኮኮሮ በሙሉ አፓቺ 2.0 ፈቃድ ነው - ኮድ እና ሞዴል ክብደት. በነጻ በኮሜርሺያል ፕሮግራሞች ውስጥ ያለማቋረጥ ሊጠቀም ይችላል.

ኮኮሮ አማርኛ (አሜሪካዊና ብሪታኒያዊ), ፈረንሳይኛ, ስፓኒሽ, ሃንዲ, ጃፓንኛ, ቻይንኛ, ጣሊያንኛ, ፖርቱጋሊኛ, እና ኮሪያኛን ይደግፋል.

ኮኮሮ ከሚገኙት በጣም ፈጣን የቲቲኤስ ሞዴሎች አንዱ ነው። ከጊዜ-አስፈላጊው የድምፅ ፍጥነት ይልቅ በሲፒዩ ላይም ቢሆን ፈጣን ነው፣ ለተግባራዊ ፕሮግራሞች ተስማሚ ነው

አይደለም፣ ኮኮሮ የድምፅ ክሎኒንግን አይደግፍም. የድምፅ ማቀነባበሪያ ችሎታዎችን ያካተተ የድምፅ መዝገብ ቤትን ይጠቀማል. የድምፅ ክሎኒንግን ለማግኘት F5-TTS, Chatterbox, StyleTTS2, OpenVoice, ወይም Tortoise ይጠቀሙ።

ኮኮሮ ሁለት ድምጾችን በአንድ ላይ በማቀላቀል የተለየ ቅንጅት ሊፈጥር ይችላል። ይህም የራሳቸውን የድምፅ ባህሪያት ያለ የድሮውን የድምፅ ክሎኒንግ መፍጠርን ያስችልዎታል።

ሁለቱም ፈጣን, ቀላል ሞዴሎች ናቸው. ኮኮሮ የበለጠ ዘመናዊ አርክቴክቸር አለው እና የድምፅ ማቀነባበሪያን ይደግፋል, በተጨማሪም ፓይፐር ትልቅ የድምፅ መዝገብ ቤት አለው. ሁለቱም ለታሪክ ጊዜ ፕሮግራሞች ምርጥ ናቸው.

ኮኮሮ በሲፒዩ ላይ እንዲሠራ የተቀየሰ ሲሆን በጣም ጥቂት የኃይል ምንጮችን ይጠቀማል - 300 ሜባ ያህል። ምንም ጂፒዩ አይጠይቅም፣ ምንም እንኳን ጂፒዩ ማሽከርከር ለከፍተኛ ፍጥነት ማከናወን የሚደገፍ ቢሆንም

አዎ. ኮኮሮ በሲፒዩ ላይም ቢሆን ከማጫወት ይልቅ ንግግርን በፍጥነት ያመነጫል፣ በጣም ዝቅተኛ ላቴንሲ ያለው፣ ስለዚህ ለቻትቦቶች፣ ለድምፅ ረዳቶች እና ለቀጥታ ስርጭት ጥሩ ነው ፡፡ የ 82M-ፓራሜትር መጠን የሜሞሪን ጥቅም ትንሽ ያደርገዋል ፣ ለከፍተኛ መጠን እና ለጫፍ መተላለፊያዎች ተግባራዊ ያደርገዋል ፡፡

የድምፅ ማቀነባበሪያ ሁለት የኮኮሮ ድምጾችን በአንድ ላይ በማቀናጀት የተለየ ንክኪን ለመፍጠር ያስችልዎታል። ይህ የቀድሞ የድምፅ ክሎኒንግ አይደለም - ከምሳሌ የተወሰነ ሰውን መፍጠር አይችሉም - ግን ከቋሚ የድምፅ መዝገብ ቤት የበለጠ ልዩነት ይሰጣል ፡፡ በTextToSpeechAI ማቀናጃ ውስጥ ቀጥተኛ በሆነ መንገድ ከሚቀላቀሉ ነገሮች ጋር መሞከር ይችላሉ።

ሁለቱም ፈጣን, CPU-friendly ስታንዳርድ-ደረጃ መሳሪያዎች የድምፅ ክሎኒንግ ሳይኖር. ኮኮሮ ቀላል ነው (በግምት 300MB) እና በ9 ቋንቋዎች ላይ የድምፅ ማቀላቀልን ይደግፋል, MeloTTS ግን በብዙ እንግሊዝኛ አቀራረቦች እና በብዙ ቋንቋዎች ላይ ያተኮረ ነው. ለትንሽ የፍሳሽ ማስወገጃ እና ማቀላቀል ኮኮሮን ይምረጡ; የተወሰኑ አቀራረቦችን ሲያሻሽሉ MeloTTSን ይምረጡ.

ኮኮሮ 1000 አሃዞች ለ 10 ክሬዲቶች የሚከፈልበት የደንበኛ ደረጃ ያለው ማሽን ነው - ዝቅተኛው ደረጃ በ TextToSpeechAI ላይ ነው. አዲስ ምዝገባዎች 200 ነፃ ክሬዲቶችን ያገኛሉ ፣ ስለዚህ ኮኮሮን ያለክፍያ መሞከር ይችላሉ ፡፡ ይህ በከፍተኛ ጥራት ያለው ንግግር ለማምረት በጣም ወጪ ቆጣቢ መንገድ ነው ፡፡

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try ኮኮሮ Now

Generate your first audio free. No credit card required.

Start Free