פתח קול

Ultra

שיכפול קול מיידי עם בקרת טון גרנולארי

Moderate מהירות
Very Good איכות
כן. שיכפול
10 שפות

אודות פתח קול

Open Voice הוא מודל שיבוט קולי רב-גוני המאפשר שליטה מלוטשת על סגנון הדיבור. בניגוד למודלים אחרים לשיבוט, Open Voice מפריד את זהות הקול מסגנון דיבור, המאפשר לך לקחת קול משובט ולהחיל צלילים שונים - עליזים, עצובים, כועסים, נרגשים או לוחשים - ללא קול התייחסות חדשה.

מאפייני מפתח

שיכפול מיידי

תשכפל כל קול מקצת שניות של שמע.

בקרת טון

החל על מצב רוח עליז, עצוב, כועס, נרגש או לוחש.

העברת סגנון

הפרדת זהות הקול מסגנון דיבור לגמישות.

הצלבת לשונית

השתמש בקולות משובטים בכל מיני שפות.

עיבוד מהיר

הסקה יעילה עבור דור קול מהיר.

פתח מקור

MIT מורשה עבור יישומים מסחריים.

השתמש בחקירות

תוכן רגשי הנפשת תווים משחקים אינטראקטיביים אנריציית שמע שיווק וידאו עוזרים וירטואליים

כיצד להשתמש פתח קול

  1. 1

    הרשמה חופשית או לנסות את הדמו

    צור חשבון חינם של TextToSpeechAI כדי לקבל קרדיטים, או השתמש בדמו בעמוד כדי לשמוע את Open Voice לפני ביצוע. אין צורך ב-GPU המקומי או להתקין - הכל פועל על השרתים שלנו.

  2. 2

    בחר קול פתוח והעלה קליפ הפניה

    בחר את מנוע Open Voice, ואז העלה מספר שניות של שמע התייחסות נקי כדי לשכפל את הקול של המטרה. פתח קול לוכד את זהות הדובר כך שתוכל להשתמש בו מחדש על פני כל טקסט וטון.

  3. 3

    הזן את הטקסט שלך

    הקלד או הדבק את התסריט שאתה רוצה שנאמר בקול המשוכפל. Open Voice תומך בסביבות 10 שפות ומשלוח בין לשוני, כך שתוכל לכתוב בשפה שונה מאשר קליפ ההתייחסות.

  4. 4

    בחר סגנון צליל ויצור

    בחר באחד מתשעת סגנונות הצליל הפתוח - ברירת המחדל, הידידותי, העליז, השמח, העצוב, הכועס, המבוהל, הצועק או לוחש - ואז יוצר אותו קול משובט ידבר עם אותו משלוח רגשי.

  5. 5

    הורד או השתמש ב־ API

    הורד את השמע שלך כ-MP3, WAV, או OGG, או ממותג דור דרך TextToSpeechAI API על ידי העברת הקול והטון המשובט שלך בסגנון בכל בקשה.

פתח קול API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "קול פתוח יכול לדבר בכל טון \u002D עליז, עצוב ואפילו לוחש.",
    "voice": "en_US-lessac-medium"
  }'

שאלות לעתים קרובות

Open Voice הוא מודל שכפול מתקדם של טקסט אל דיבור, שמפריד באופן ייחודי בין זהות קול לסגנון דיבור. זה מאפשר לך לשבט קול ולהחיל צלילים רגשיים שונים מבלי צורך בקול התייחסות חדש לכל רגש. זה בנוי עבור ביטוי, ביטוי, קריא.

כן, קול פתוח מבצע שיבוט קול מיידי מכמה שניות של שמע - אין צורך בתרגילי הדרכה. ברגע שקול נתפס, הקול הפתוח יכול להשתמש שוב בזהות זו על פני כל טקסט וכל סגנון צליל שתבחר.

Open Voice משתמש בארכיטקטורה דו-שלבית שמתפצלת מסינתזה של דיבור בסיסי מהמרה של טון. לאחר שיבוט קול, ניתן ליישם כל אחד מ-9 סגנונות צליל - ברירת מחדל, ידידותי, עליז, נרגש, עצוב, מפוחד, צועק או לוחש - ואותו קול משובט מדבר בצורה שונה על הטון הנבחר שלך מבלי להקליט מחדש.

כל סגנון מעצב מחדש את המשלוח הרגשי תוך שמירה על זהות הדובר המשובטת, מה שנותן לך שליטה טובה על אופן הקריאה.

Open Voice הוא קוד פתוח תחת רישיון MIT מתירני, כך הוא חינם לשימוש מסחרי. כמו בכל מודל שיבוט, ודא שיש לך זכויות נאותות לכל קול שאתה משכפל עבור פרויקטים מסחריים.

Open Voice תומכת בסביבות 10 שפות, כולל אנגלית, סינית, יפנית, קוריאנית ומספר שפות אירופאיות. היא גם מציעה שיבוט בין לשוני, כך שתוכל לשבט קול בשפה אחת, ולגרום לו לדבר באופן טבעי בשפה אחרת.

ל"פתיחה קולית" יש מהירות דורית מתונה, בדרך כלל קביעת משפט תוך 2-4 שניות על איכות פלט GPU היא טובה מאוד, עם רבייה קולית ברורה והעברת טון ששומרת על זהות הדובר ללא פגע תוך שינוי משכנע של משלוח רגשי.

Open Voice בדרך כלל דורש 6-8GB של VRAM בהתאם לגודל אצווה ועומס המרה טון. הוא פועל בנוחות על אמצע טווח עד GPUs באמצע הטווח העליון, ועל TextToSpeechAI כל זה מטופל בשרתים שלנו כך שאתה לא צריך כל חומרה מקומית.

Open Voice הוא מנוע אולטרא-טייר, במחיר של 50 נקודות צלזיוס לכל 1000 תווים.

Open Voice הוא ייחודי עבור הטון והשליטה בסגנון: באפשרותך לקחת קול משובט אחד ולהעבירו שוב בשמחה, עצובה, כועסת או לוחשת. F5-TTS מהיר יותר והוא מנוע השיבוט שלנו כברירת מחדל לדיבור טבעי וניטראלי. בחר בקול פתוח כאשר אתה צריך שליטה בסגנון רגשי, וF5-TTS כאשר אתה רוצה שיבוט טבעי מהיר יותר.

צור קול משובט על ידי העלאת שמע הפניה, ואז ציין סגנון צליל בבקשתך API. ה- API מתייחס לטון הרגשי הנבחר שלך לקול המשובט באופן אוטומטי ומחזיר את השמע בפורמט MP3, WAV, או OGG.

כן, הרשמה לחשבון חינם של TextToSpeechAI כדי לקבל אשראי של המתחיל ולנסות שיבוט קול פתוח ושליטה בטון, או להשתמש בדמו בעמוד ראשון. אין הגדרה מקומית - להעלות קליפ הפניה, לבחור צליל, וליצור בדפדפן.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try פתח קול Now

Generate your first audio free. No credit card required.

Start Free