ओपनभाइज

Ultra

ग्र्यान्युलर टोन नियन्त्रणसँग तत्काल आवाज क्लोनिङ

Moderate गति
Very Good गुणस्तर
हो क्लोनिङ
10 भाषा

यसका बारेमा ओपनभाइज

of the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the

कुञ्जी विशेषताहरू

तत्काल क्लोनिङ

अडियोको केही सेकेन्डबाट कुनै पनि आवाज क्लोन गर्नुहोस् ।

टोन नियन्त्रण

Apply cheerful, sad, angry, excited, or whisper tones.

शैली स्थानान्तरण

यसले भाषाको भाषागत विशेषतालाई स्पष्ट पार्न मद्दत गर्दछ ।

क्रस- भाषा

विभिन्न भाषाहरूमा क्लोन गरिएको आवाजहरू प्रयोग गर्नुहोस् ।

छिटो प्रक्रिया

यसले द्रुत गतिमा सञ्चारको विकास गर्यो ।

खुला स्रोत

यो पत्रिकाको प्रकाशक वाणिज्य संघ हो।

केस प्रयोग गर्नुहोस्

भावनात्मक सामाग्री क्यारेक्टर एनिमेसन अन्तरक्रियात्मक खेलName अडियो पुस्तक वर्णन मार्केटिङ भिडियोहरू अवास्तविक सहायक

कसरी प्रयोग गर्ने ओपनभाइज

  1. 1

    निःशुल्क दर्ता गर्नुहोस् वा डेमो प्रयास गर्नुहोस्

    सुरुआत क्रेडिट प्राप्त गर्न एक निःशुल्क TextToSpeechAI खाता सिर्जना गर्नुहोस्, वा प्रतिबद्ध हुनु अघि ओपनभीसी सुन्न पृष्ठ-डेमो प्रयोग गर्नुहोस्। कुनै स्थानीय GPU वा स्थापना आवश्यक छ - सबै हाम्रो सर्भरमा चल्छ।

  2. 2

    ओपनभाइज चयन गर्नुहोस् र सन्दर्भ क्लिप अपलोड गर्नुहोस्

    खुला आवाज इन्जिन चयन गर्नुहोस्, त्यसपछि लक्ष्य आवाज तत्काल क्लोन गर्न सफा सन्दर्भ अडियोको केही सेकेन्ड अपलोड गर्नुहोस् । खुला आवाजले वक्ता पहिचान समात्दछ ताकि तपाईँले यसलाई कुनै पनि पाठ र टोन मार्फत पुन: प्रयोग गर्न सक्नुहुन्छ ।

  3. 3

    तपाईँको पाठ प्रविष्ट गर्नुहोस्

    तपाईँले क्लोन गरिएको आवाजमा बोल्न चाहनु भएको स्क्रिप्ट टाइप वा टाँस्नुहोस् । खुला आवाजले १० भाषा र क्रस-भाषा वितरण समर्थन गर्दछ, त्यसैले तपाईँ सन्दर्भ क्लिप भन्दा फरक भाषामा लेख्न सक्नुहुन्छ ।

  4. 4

    टोन शैली रोज्नुहोस् र सिर्जना गर्नुहोस्

    नौ ओपनभ्वाइस टोन शैलीहरू मध्ये एउटा रोज्नुहोस् - पूर्वनिर्धारित, मित्रवत, खुसी, उत्तेजित, दुःखी, रिसाएको, डराएको, चिच्याउने, वा फुस्राउँदो - त्यसपछि उत्पन्न गर्नुहोस् । उही क्लोन गरिएको आवाजले त्यो भावनात्मक वितरणसँग कुरा गर्नेछ ।

  5. 5

    API डाउनलोड वा प्रयोग गर्नुहोस्

    MP3 रूपमा आफ्नो अडियो डाउनलोड, WAV, वा OGG, वा प्रत्येक अनुरोध मा आफ्नो क्लोन आवाज र टोन शैली पारित गरेर TextToSpeechAI एपीआई मार्फत स्वचालित पुस्ता।

ओपनभाइज एपीआई

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "यो शब्दको अर्थ हुन्छ \u002D कुनै पनि कुराको स्पर्श, स्पर्श, वा स्पर्शको स्पर्श।",
    "voice": "en_US-lessac-medium"
  }'

प्राय सोधिने प्रश्न

ओपनभाइज एउटा उन्नत पाठ-देखि-भाषण र आवाज क्लोनिङ मोडेल हो जसले अद्वितीय रूपमा बोल्ने शैलीबाट आवाज पहिचान अलग गर्दछ । यसले तपाईँलाई आवाज क्लोन गर्न र त्यसपछि प्रत्येक भावनाका लागि नयाँ सन्दर्भ अडियो आवश्यक नभएको फरक भावनात्मक टोन लागू गर्न अनुमति दिन्छ । यो अभिव्यक्ति, नियन्त्रणयोग्य भाषण उत्पन्नका लागि निर्माण गरिएको छ ।

हो, खुला आवाजले सन्दर्भ अडियोको केही सेकेन्डबाट तत्काल आवाज क्लोनिङ गर्दछ - कुनै प्रशिक्षण चलाउनु आवश्यक छैन । एक पटक आवाज क्याप्चर भएपछि, खुला आवाजले तपाईँले चयन गरेको कुनै पनि पाठ र कुनै पनि टोन शैलीमा त्यो पहिचान पुन: प्रयोग गर्न सक्छ ।

ओपनभीएसीले टोन रूपान्तरणबाट आधारभूत भाषण संश्लेषण विभाजन गर्ने दुई चरणको वास्तुकला प्रयोग गर्दछ । आवाज क्लोन गरेपछि, तपाईँले ९ टोन शैलीहरू - पूर्वनिर्धारित, मित्रतापूर्ण, खुसी, उत्तेजित, दुःखी, रिसाएको, डराएको, कराइरहेको, वा मुसुक्क हाँस्दै - को कुनै पनि लागू गर्न सक्नुहुन्छ र उही क्लोन गरिएको आवाजले पुन: रेकर्ड नगरी तपाईँको रोजेको टोनमा आधारित फरक कुरा गर्छ ।

ओपनभाइजले नौ वटा बोल्ने शैलीहरू समर्थन गर्दछ: पूर्वनिर्धारित, मित्रवत, खुसी, उत्तेजित, दुःखी, रिसाएको, डराएको, कराइरहेको, र फुस्राउँदो। प्रत्येक शैलीले क्लोन गरिएको वक्ता पहिचानलाई संरक्षित गर्दा भावनात्मक वितरणलाई पुन: आकार दिन्छ, तपाईँलाई लाइन पढ्ने तरिकामाथि राम्रो-ग्रिन नियन्त्रण दिन्छ।

ओपनभाइज अनुमति दिने एमआईटी लाइसेन्स अन्तर्गत खुला स्रोत हो, त्यसैले यो व्यावसायिक प्रयोगका लागि निःशुल्क छ । कुनै पनि क्लोनिङ मोडेलसँग जस्तै, तपाईँसँग व्यावसायिक परियोजनाका लागि क्लोन गर्ने कुनै पनि आवाजमा उचित अधिकार भएको निश्चित गर्नुहोस् ।

OpenVoice अंग्रेजी, चिनियाँ, जापानी, कोरियाली, र विभिन्न युरोपेली भाषाहरू सहित 10 भाषाहरूको वरिपरि समर्थन गर्दछ। यो पनि क्रस-भाषा क्लोनिंग प्रस्ताव गर्दछ, त्यसैले तपाईं एक भाषामा आवाज क्लोन गर्न सक्नुहुन्छ र अर्कोमा प्राकृतिक रूपमा बोल्न सक्नुहुन्छ।

ओपनभिएसन मध्यम उत्पादन गति छ, सामान्यतया GPU मा 2-4 सेकेन्डमा वाक्य रेन्डरिङ। निर्गत गुणस्तर धेरै राम्रो छ, स्पष्ट आवाज प्रजनन र टोन स्थानान्तरण संग वक्ता पहिचान अचल राख्छ जबकि convincingly भावनात्मक वितरण परिवर्तन।

OpenVoice सामान्यतया आवश्यक छ 6-8GB VRAM को ब्याच आकार र टोन रूपान्तरण लोड निर्भर। यो मध्य-दायरा मा उच्च मध्य-दायरा GPUs मा आरामदायक चल्छ, र मा TextToSpeechAI यो सबै हाम्रो सर्भर मा ह्यान्डल छ त्यसैले तपाईं कुनै पनि स्थानीय हार्डवेयर आवश्यक छैन।

ओपनभीएस एक अल्ट्रा-तह इन्जिन हो, प्रति 50 क्रेडिट प्रति 1000 क्यारेक्टर मूल्य। अल्ट्रा तह यसको उन्नत टोन नियन्त्रण र क्लोनिङ प्लस शैली-परिवर्तन पाइपलाइनको लागि आवश्यक अतिरिक्त कम्प्युट प्रतिबिम्बित।

ओपनभाइज यसको टोन र शैली नियन्त्रणका लागि अद्वितीय छ: तपाईँले एउटा क्लोन गरिएको आवाज लिन सक्नुहुन्छ र यो खुशी, दुःखी, रिसाएको, वा फुस्राउँदो रूपमा पुन: वितरण गर्न सक्नुहुन्छ । F5-TTS छिटो छ र प्राकृतिक, तटस्थ भाषणका लागि हाम्रो पूर्वनिर्धारित क्लोनिङ इन्जिन हो । तपाईँलाई भावनात्मक शैली नियन्त्रण आवश्यक पर्दा ओपनभाइज रोज्नुहोस्, र तपाईँले छिटो प्राकृतिक क्लोन चाहनुहुन्छ भने F5-TTS ।

सन्दर्भ अडियो अपलोड गरेर क्लोन गरिएको आवाज सिर्जना गर्नुहोस्, त्यसपछि तपाईँको API अनुरोधमा टोन शैली निर्दिष्ट गर्नुहोस् । API ले क्लोन गरिएको आवाजमा तपाईँको चयन गरिएको भावनात्मक टोन स्वचालित रूपमा लागू गर्दछ र MP3, WAV, वा OGG ढाँचामा अडियो फर्काउँछ ।

Yes. Sign up for a free TextToSpeechAI account to receive starter credits and try OpenVoice cloning and tone control, or use the on-page demo first. There is no local setup - upload a reference clip, pick a tone, and generate in the browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try ओपनभाइज Now

Generate your first audio free. No credit card required.

Start Free