Kokoro

Standard

ברק מהיר, TTS קל עם איכות טבעית

Very Fast מהירות
Good איכות
לא. שיכפול
9 שפות

אודות Kokoro

קוקורו הוא מודל בעל משקל קל של 82M, המספק דיבור טבעי במהירות מדהימה. הוא רץ במהירות קרובה בזמן אמת אפילו על מעבד, מה שהופך אותו לאידיאל ליישומים שבהם השהיה נמוכה היא קריטית. קוקורו תומך בשפות מרובות ומציע יכולות מיזוג קול.

מאפייני מפתח

משקל בהיר

82M פרמטרים, גודל מודל ~300MB פועל על מעבד עם משאבים מינימליים.

קרוב לזמן אמת

מייצר דיבור מהר יותר ממהירות השמעה, אפילו בלי האצת GPU.

רב־ שפה

תמיכה באנגלית, צרפתית, ספרדית, הינדית, יפנית, סינית, איטלקית, פורטוגזית וקוריאנית.

צפצוף קול

ערבבו שני קולות יחד כדי ליצור שילובים קוליים ייחודיים.

השתמש בחקירות

רובוטי צ'אט בזמן אמת ועוזרים וירטואליים הזרמת טקסט לדיבור בשידור חי פריסת קצה ויישום נייד עיבוד אצווה רב עוצמה

כיצד להשתמש Kokoro

  1. 1

    הרשמה חופשית או לנסות את הדמו

    צור חשבון TextToSpeechAI חינם כדי לקבל 200 נקודות זכות, או השתמש בדמו ללא חתימה כדי לשמוע את קוקורו מיד.

  2. 2

    בחר קול של קוקורו

    פתח את דפדפן הקול ובחר קול Kokoro בשפת היעד שלך (9 נתמך, מאנגלית ליפנית וקוריאנית). באפשרותך גם להשתמש בקול Kokoro להתמזג לערבב שני קולות לתוך שילוב מותאם אישית.

  3. 3

    הזן את הטקסט שלך

    הקלד או הדבק את הטקסט שאתה רוצה שנאמר אל העורך. Kokoro מטפל במעברים ארוכים ביעילות הודות ל-82 מ"מ קל משקל שלה, ליד מנוע בזמן אמת.

  4. 4

    התאם מהירות ויצור

    כוון את מהירות הפלייבק כדי להתאים את מקרה השימוש שלך, ואז לחץ על יצירת הנגינה. קוקורו ממיר את השמע מהר יותר מאשר בזמן אמת, כך שהנאום שלך מוכן כמעט מיד.

  5. 5

    הורד או השתמש ב־ API

    הורד את השמע הסופי כ-MP3 או WAV, או דור אוטומטי של TextToSpeechAI יחידות API ב- Api.Texttospeechai.com עבור אצווה ועומס עבודה בזמן אמת.

Kokoro API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "קוקורו מספק דיבור טבעי במהירות ויעילות מדהימות.",
    "voice": "en_US-lessac-medium"
  }'

שאלות לעתים קרובות

קוקורו הוא מודל בעל משקל קל במיוחד של טקסט לנאום עם 82 מיליון פרמטרים בלבד. למרות גודלו הקטן, הוא מייצר דיבור שנשמע טבעי על פני שפות מרובות במהירות קרובה לזמן אמת, אפילו על מעבד.

כן, לקוקורו יש רישיון מלא לאפצ'י 2.0 - קוד ומשקולות מודלים.

קוקורו תומך באנגלית (ארה"ב ובריטניה), צרפתית, ספרדית, הינדית, יפנית, סינית, איטלקית, פורטוגזית וקוריאנית.

קוקורו הוא אחד המודלים המהירים ביותר של TTS, הוא מייצר דיבור מהר יותר ממהירות השמעה בזמן אמת אפילו במעבד, מה שהופך אותו לאידיאלי ליישומים אינטראקטיביים.

לא, קוקורו לא תומך בשיבוט קול, הוא משתמש בספריית קול מאומצת עם יכולות מיזוג קול, לשיבוט קול, שימוש ב-F5-TTS, צ'אטרבוקס, סטיילט-2, קול פתוח או צב.

קוקורו יכול לערבב שני קולות יחד כדי ליצור שילובים ייחודיים. דבר זה מאפשר לך ליצור מאפיינים קוליים מותאמים אישית ללא שיבוט קולי מסורתי.

שניהם מודלים מהירים וקלים יותר לקוקורו יש ארכיטקטורה מודרנית יותר ותומך במיזוג קול בעוד שלפייפר יש ספריית קול גדולה יותר שניהם מצוינים ליישומים בזמן אמת

Kokoro מיועד לרוץ על מעבד ודורש משאבים מינימליים - כ-300MB. אין צורך בGPU, אם כי האצה GPU נתמכת אפילו לעיבוד מהיר יותר.

כן. קוקורו מייצר דיבור מהר יותר מהקלטה אפילו במעבד, עם צניחה נמוכה מאוד, כך שהוא מתאים מצוין לצ'אטוטים, לעוזרי קול, וזרימת חיים. גודלו של ה-82 מ"מ

שילוב קול מאפשר לך לערבב שני קולות של קוקורו כדי ליצור שילוב ייחודי עם מאפיינים מותאמים אישית. אין זה שיבוט קולי מסורתי - אינך יכול לשחזר אדם מסוים ממדגימה - אך הוא נותן לך מגוון רב יותר מספריית קול קבועה. אתה יכול להתנסות בתערובת ישירות בעורך TextToSpeechAI.

שניהם מהירים, מנועי מעבדים תקניים ידידותיים יותר ללא שיבוט קול. קוקורו הוא הקל ביותר (כ-300MB) ותומך בקול המתמזג על פני 9 שפות, בעוד שMelotts מתמקד במבטאים רבים באנגלית ופלט רב לשוני בזמן אמת. בחר בקוקורו עבור טביעת הרגל הקטנה ביותר והתמזגות; בחר ב-MelottS כאשר אתה צריך מבטאים ספציפיים.

קוקורו הוא מנוע סטנדרטי, עולה 10 נקודות לכל 1000 תווים - השורה הנמוכה ביותר ב-TextToSpeechAI. חשבונות חדשים מקבלים 200 נקודות זכות בחינם, כך שניתן לנסות את קוקורו בלי לשלם. זה הופך אותו לאחת הדרכים הכי חסכוניות ליצור נאום באיכות גבוהה בקנה מידה.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try Kokoro Now

Generate your first audio free. No credit card required.

Start Free