Öppna röst

Ultra

Direkt röst kloning med Granular Tone Control

Moderate Varvtal
Very Good Kvalitet
- Ja, det är jag. Kloning
10 Språk

Om jag inte kan Öppna röst

OpenVoice är en mångsidig modell för omedelbar röstkloning som ger finkornig kontroll över talande stil. Till skillnad från andra kloningsmodeller skiljer OpenVoice röstidentitet från talande stil, så att du kan ta en klonad röst och tillämpa olika toner - glad, ledsen, arg, upphetsad, eller viskande - utan nya referensljud.

Viktiga egenskaper

Snabbknäppning

-Klara alla röster från några sekunder.

Tonkontroll

Applicera glada, ledsna, arga, upphetsade eller viskande toner.

Stilöverföring

Separat röstidentitet från talstil för flexibilitet.

Gränsöverskridande

Använd klonade röster över olika språk.

Snabb behandling

Effektiva slutsatser för snabb talgenerering.

Öppna källkod

MIT licensierad för kommersiella tillämpningar.

Användningsfall

Känslomässigt innehåll Teckenanimering Interaktiva spel Ljudboksrapportering Videor för marknadsföring Virtuella assistenter

Hur du använder Öppna röst

  1. 1

    Registrera dig gratis eller prova demo

    Skapa ett gratis TextToSpeechAI-konto för att få startpoäng, eller använd demo på sidan för att höra OpenVoice innan du gör ett åtagande. Ingen lokal GPU eller installation behövs - allt körs på våra servrar.

  2. 2

    Välj OpenVoice och ladda upp ett referensklipp

    Välj OpenVoice-motorn, ladda sedan upp några sekunder av rent referensljud för att omedelbart klona målrösten. OpenVoice fångar högtalaridentiteten så att du kan återanvända den över vilken text och ton som helst.

  3. 3

    Skriv in din text

    Skriv eller klistra in skriptet du vill tala i den klonade rösten. OpenVoice stöder runt 10 språk och tvärspråkig leverans, så att du kan skriva på ett annat språk än referensklippet.

  4. 4

    Välj en ton stil och generera

    Välj en av de nio OpenVoice ton stilar - standard, vänliga, glada, upphetsad, ledsen, arg, skräckslagen, skrikande, eller viskning - sedan generera. Samma klonade röst kommer att tala med den känslomässiga leverans.

  5. 5

    Ladda ner eller använd API:et

    Ladda ner ditt ljud som MP3, WAV, eller OGG, eller automatisera generation genom TextToSpeechAI API genom att skicka din klonade röst och ton stil i varje begäran.

Öppna röst API: er

Skapa talprogrammatiskt med TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice kan tala i vilken ton som helst \u002D glad, ledsen, eller till och med viska.",
    "voice": "en_US-lessac-medium"
  }'

Vanliga frågor

OpenVoice är en avancerad modell för tal-till-tal- och röstkloning som unikt skiljer röstidentitet från talstil. Detta låter dig klona en röst och sedan tillämpa olika emotionella toner utan att behöva nytt referensljud för varje känsla. Det är byggt för uttrycksfull, kontrollerbar talgenerering.

Ja, OpenVoice utför omedelbar röst kloning från bara några sekunder av referensljud - ingen träning kör krävs. När en röst fångas, kan OpenVoice återanvända den identiteten över vilken text och vilken ton stil du väljer.

OpenVoice använder en tvåstegsarkitektur som delar upp talsyntesen från tonkonvertering. Efter kloning av en röst kan du använda vilken som helst av 9 tonstilar - standard, vänliga, glada, glada, upprörda, arga, skräckslagna, skrikande eller viskande - och samma klonade röst talar annorlunda baserat på din valda ton utan att spela in igen.

OpenVoice stöder nio talande stilar: standard, vänliga, glada, upphetsade, ledsen, arg, skräckslagen, skrikande och viskande. Varje stil omformar den känslomässiga leveransen samtidigt som den klonade högtalaren identitet, ger dig finkornig kontroll över hur en linje läses.

OpenVoice är öppen källkod under den tillåtande MIT-licensen, så det är gratis för kommersiell användning. Som med alla kloningsmodeller, se till att du har rätt till alla röster du klonar för kommersiella projekt.

OpenVoice stöder runt 10 språk, inklusive engelska, kinesiska, japanska, koreanska och flera europeiska språk. Det erbjuder också tvärspråkig kloning, så att du kan klona en röst på ett språk och få det att tala naturligt på ett annat.

OpenVoice har måttlig generationshastighet, vanligtvis gör en mening i 2-4 sekunder på en GPU. Utgångskvalitet är mycket bra, med tydlig röst reproduktion och tonöverföring som håller högtalarens identitet intakt samtidigt övertygande ändra emotionell leverans.

OpenVoice kräver normalt 6-8 GB VRAM beroende på batchstorlek och ton konverteringsbelastning. Det körs bekvämt på mellan- och övre mellan-intervall GPU, och på TextToSpeechAI allt detta hanteras på våra servrar så att du inte behöver någon lokal hårdvara.

OpenVoice är en Ultra-tier motor, prissatt till 50 krediter per 1000 tecken. Ultra-nivån återspeglar sin avancerade tonkontroll och den extra beräkning som behövs för kloning plus stil-konversion pipeline.

OpenVoice är unik för sin ton och stil kontroll: du kan ta en klonad röst och åter leverera den som glad, ledsen, arg, eller viskande. F5-TTS är snabbare och är vår standard kloning motor för naturligt, neutralt tal. Välj OpenVoice när du behöver emotionell stil kontroll, och F5-TTS när du vill ha den snabbaste naturliga klon.

Skapa en klonad röst genom att ladda upp referensljud, och ange sedan en ton stil i din API-begäran. APIet tillämpar din valda emotionella ton på den klonade rösten automatiskt och returnerar ljudet i MP3, WAV, eller OGG-format.

Ja. Registrera dig för ett gratis TextToSpeechAI-konto för att få startpoäng och prova OpenVoice kloning och tonkontroll, eller använd demo på sidan först. Det finns ingen lokal inställning - ladda upp ett referensklipp, välj en ton, och generera i webbläsaren.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try Öppna röst Now

Generate your first audio free. No credit card required.

Start Free