ስለ Kokoro
Kokoro is an ultra-lightweight 82M parameter TTS model that delivers natural-sounding speech at incredible speed. It runs near real-time even on CPU, making it ideal for applications where low latency is critical. Kokoro supports multiple languages and offers voice blending capabilities.
የቁልፍ ባህሪያት
Ultra-Lightweight
82M ፐራሜትሮች, ~300MB ሞዴል መጠን. በ CPU ላይ በትንሽ መሳሪያዎች ላይ ይሠራል.
Near Real-Time
Generates speech faster than playback speed, even without GPU acceleration.
Multi-Language
Supports English, French, Spanish, Hindi, Japanese, Chinese, Italian, Portuguese, and Korean.
Voice Blending
Mix two voices together to create unique voice combinations.
ጥቅም
Real-time chatbots and virtual assistants
Live streaming text-to-speech
Edge deployment and mobile applications
High-volume batch processing
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
ኮኮሮ 82 ሚሊዮን ፓራሜትሮች ብቻ ያለው ቀላል የጽሑፍ-ወደ-ንግግር ሞዴል ነው. በትንሹ መጠን ላይ እንኳ በብዙ ቋንቋዎች ላይ በቅርብ ጊዜ ፍጥነት በሲፒዩ ላይም ቢሆን ተፈጥሯዊ የሆነ ንግግርን ያመጣል.
አዎ, ኮኮሮ በሙሉ አፓቺ 2.0 ፈቃድ ነው - ኮድ እና ሞዴል ክብደት. በነጻ በኮሜርሺያል ፕሮግራሞች ውስጥ ያለማቋረጥ ሊጠቀም ይችላል.
ኮኮሮ አማርኛ (አሜሪካዊና ብሪታኒያዊ), ፈረንሳይኛ, ስፓኒሽ, ሃንዲ, ጃፓንኛ, ቻይንኛ, ጣሊያንኛ, ፖርቱጋሊኛ, እና ኮሪያኛን ይደግፋል.
ኮኮሮ ከሚገኙት በጣም ፈጣን የቲቲኤስ ሞዴሎች አንዱ ነው። ከጊዜ-አስፈላጊው የድምፅ ፍጥነት ይልቅ በሲፒዩ ላይም ቢሆን ፈጣን ነው፣ ለተግባራዊ ፕሮግራሞች ተስማሚ ነው
አይደለም፣ ኮኮሮ የድምፅ ክሎኒንግን አይደግፍም. የድምፅ ማቀነባበሪያ ችሎታዎችን ያካተተ የድምፅ መዝገብ ቤትን ይጠቀማል. የድምፅ ክሎኒንግን ለማግኘት F5-TTS, Chatterbox, StyleTTS2, OpenVoice, ወይም Tortoise ይጠቀሙ።
ኮኮሮ ሁለት ድምጾችን በአንድ ላይ በማቀላቀል የተለየ ቅንጅት ሊፈጥር ይችላል። ይህም የራሳቸውን የድምፅ ባህሪያት ያለ የድሮውን የድምፅ ክሎኒንግ መፍጠርን ያስችልዎታል።
ሁለቱም ፈጣን, ቀላል ሞዴሎች ናቸው. ኮኮሮ የበለጠ ዘመናዊ አርክቴክቸር አለው እና የድምፅ ማቀነባበሪያን ይደግፋል, በተጨማሪም ፓይፐር ትልቅ የድምፅ መዝገብ ቤት አለው. ሁለቱም ለታሪክ ጊዜ ፕሮግራሞች ምርጥ ናቸው.
ኮኮሮ በሲፒዩ ላይ እንዲሠራ የተቀየሰ ሲሆን በጣም ጥቂት የኃይል ምንጮችን ይጠቀማል - 300 ሜባ ያህል። ምንም ጂፒዩ አይጠይቅም፣ ምንም እንኳን ጂፒዩ ማሽከርከር ለከፍተኛ ፍጥነት ማከናወን የሚደገፍ ቢሆንም
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10