कोकोरो
Standardप्राकृतिक गुणस्तर संग चम्किलो- छिटो, हल्का TTS
यसका बारेमा कोकोरो
82M parameter TTS model, which is the most powerful TTS model available. It is the first TTS model to support 82M parameters, and the first TTS model to support 82M parameters in the world. Kokoro is the first TTS model to support 82M parameters in the world.
कुञ्जी विशेषताहरू
अति हल्का
82M परिमितिहरू, ~300MB मोडेल साइज। न्यूनतम स्रोतहरूसँग सीपीयूमा चल्छ।
वास्तविक समय नजिक
GPU त्वरण बिना पनि, प्लेब्याक गति भन्दा छिटो भाषण उत्पन्न गर्दछ ।
बहुभाषिक
अंग्रेजी, फ्रान्सेली, स्पेनिश, हिन्दी, जापानी, चिनियाँ, इटालियन, पोर्चुगिज, र कोरियाली समर्थन गर्दछ।
आवाज मिश्रण
अद्वितीय आवाज संयोजन सिर्जना गर्न दुई आवाजहरू एकैसाथ मिश्रण गर्नुहोस् ।
केस प्रयोग गर्नुहोस्
कसरी प्रयोग गर्ने कोकोरो
-
1
निःशुल्क दर्ता गर्नुहोस् वा डेमो प्रयास गर्नुहोस्
200 स्टार्ट क्रेडिटहरू प्राप्त गर्न एक नि: शुल्क TextToSpeechAI खाता सिर्जना गर्नुहोस्, वा कोकोरो सुन्न तत्काल कुनै-साइन अप डेमो प्रयोग गर्नुहोस्। मानक तहको अर्थ कोकोरो प्रति 1000 क्यारेक्टरहरूमा 10 क्रेडिटहरू मात्र खर्च हुन्छ।
-
2
कोकोरो आवाज चयन गर्नुहोस्
आवाज ब्राउजर खोल्नुहोस् र आफ्नो लक्ष्य भाषामा कोकोरो आवाज चयन गर्नुहोस् (9 समर्थित, अंग्रेजी देखि जापानी र कोरियाली). तपाईं पनि अनुकूल संयोजनमा दुई आवाज मिश्रण गर्न कोकोरो आवाज मिश्रण प्रयोग गर्न सक्नुहुन्छ।
-
3
तपाईँको पाठ प्रविष्ट गर्नुहोस्
टाइप वा टाँस्नुहोस् तपाईँले सम्पादकमा बोल्न चाहनु भएको पाठ । कोकोरोले लामो पदहरू कुशलतापूर्वक यसको हल्का 82M-परिमिति, नजिकैको वास्तविक-समय इन्जिनलाई धन्यवाद ह्यान्डल गर्दछ ।
-
4
गति समायोजन गर्नुहोस् र सिर्जना गर्नुहोस्
तपाईँको प्रयोगको केस मिलाउन प्लेब्याक गति सेट गर्नुहोस्, त्यसपछि उत्पन्न गर्नुहोस् क्लिक गर्नुहोस् । कोकोरोले वास्तविक समय भन्दा अडियो छिटो रेन्डर गर्दछ, त्यसैले तपाईँको भाषण लगभग तुरुन्तै तयार हुन्छ ।
-
5
API डाउनलोड वा प्रयोग गर्नुहोस्
MP3 वा WAV को रूपमा समाप्त अडियो डाउनलोड गर्नुहोस्, वा ब्याच र वास्तविक समय कार्यभारको लागि api.texttospeechai.com मा TextToSpeechAI REST API मार्फत उत्पादन स्वचालित गर्नुहोस्।
कोकोरो एपीआई
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "यसले प्राकृतिक र मानवीय दुवै प्रकारका क्रियाकलापलाई प्रभाव पार्छ।",
"voice": "en_US-lessac-medium"
}'
प्राय सोधिने प्रश्न
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10