OpenVoice

Ultra

Øjeblikkelig stemme cloning med Granular Tone Control

Moderate Hastighed
Very Good Kvalitet
Ja Kloning
10 Sprog

Om OpenVoice

OpenVoice er en alsidig instant stemme kloning model, der giver mulighed for finkornet control over tale stil. I modsætning til andre kloning modeller, OpenVoice adskiller stemme identitet fra tale stil, så du kan tage en klonet stemme og anvende forskellige toner - munter, trist, vred, ophidset, eller hvisken - uden ny reference lyd.

Nøglefunktioner

Øjeblikkelig kloning

Klon enhver stemme fra blot et par sekunders lyd.

Tonekontrol

Anvend glade, triste, vrede, spændte eller hviskende toner.

Stiloverførsel

Separat stemme identitet fra tale stil for fleksibilitet.

Tværlang

Brug klonede stemmer på tværs af forskellige sprog.

Hurtig behandling

Effektiv konsekvens for hurtig stemme generation.

Åbn kilde

MIT licenseret til kommercielle applikationer.

Brugstilfælde

Følelsesmæssigt indhold Tegnanimation Interaktive spil LydbogsfortællingName Markedsføringsvideoer Virtuelle assistenter

Hvordan man bruger OpenVoice

  1. 1

    Tilmeld dig gratis eller prøv demoen

    Opret en gratis TextToSpeechAI konto for at få startkreditter, eller brug sidedemoen til at høre OpenVoice før du begår. Der er ikke brug for lokal GPU eller installation - alt kører på vores servere.

  2. 2

    Vælg OpenVoice og upload et referenceklip

    Vælg OpenVoice motor, derefter uploade et par sekunders ren reference lyd til straks klone målet stemme. OpenVoice fanger højttaler identitet, så du kan genbruge det på tværs af enhver tekst og tone.

  3. 3

    Indtast din tekst

    Indtast eller indsæt det script du vil have talt i den klonede stemme. OpenVoice understøtter omkring 10 sprog og levering på tværs af sprog, så du kan skrive på et andet sprog end referenceklipset.

  4. 4

    Vælg en tone stil og generere

    Vælg en af de ni OpenVoice tone stilarter - standard, venlig, munter, begejstret, trist, vred, skrækslagen, råbe, eller hvisken - derefter generere. Den samme klonede stemme vil tale med denne følelsesmæssige levering.

  5. 5

    Download eller brug API'en

    Download din lyd som MP3, WAV, eller OGG, eller automatisere generation gennem TextToSpeechAI API ved at passere din klonede stemme og tone stil i hver anmodning.

OpenVoice API

Generer tale programmatisk ved hjælp af TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice kan tale i enhver tone \u002D munter, trist, eller endda hviske.",
    "voice": "en_US-lessac-medium"
  }'

Ofte stillede spørgsmål

OpenVoice er en avanceret tekst- til- tale og stemme kloning model, der unikt adskiller stemme identitet fra tale stil. Dette lader dig klone en stemme og derefter anvende forskellige følelsesmæssige toner uden at behøve ny reference lyd for hver følelse. Det er bygget til udtryksfulde, kontrollerbar tale generation.

Ja, OpenVoice udfører øjeblikkelig stemmekloning fra blot et par sekunders reference audio - ingen træningskørsel kræves. Når en stemme er fanget, OpenVoice kan genbruge denne identitet på tværs af enhver tekst og enhver tone stil, du vælger.

OpenVoice bruger en to-trins arkitektur, der opdeler base talesyntese fra tone konvertering. Efter kloning en stemme, kan du anvende nogen af 9 tone stilarter - standard, venlig, munter, ophidset, trist, vred, skrækslagen, råbe, eller hvisken - og den samme klonede stemme taler forskelligt baseret på din valgte tone uden re-optagelse.

OpenVoice understøtter ni talende stilarter: standard, venlig, munter, ophidset, trist, vred, skrækslagen, råbe, og hvisken. Hver stil omforme den følelsesmæssige levering samtidig bevare klonede højttaler identitet, hvilket giver dig finkornet kontrol over, hvordan en linje læses.

OpenVoice er open source under den eftergivende MIT licens, så det er gratis til kommerciel brug. Som med enhver kloning model, skal du sørge for at have ordentlige rettigheder til enhver stemme, du kloner til kommercielle projekter.

OpenVoice understøtter omkring 10 sprog, herunder engelsk, kinesisk, japansk, koreansk, og flere europæiske sprog. Det tilbyder også kloning på tværs af sprog, så du kan klone en stemme på ét sprog og få det til at tale naturligt på et andet.

OpenVoice har moderat generation hastighed, typisk gør en sætning i 2-4 sekunder på en GPU. Output kvalitet er meget god, med klar stemmegengivelse og tone overførsel, der holder højttaler identitet intakt, mens overbevisende skiftende emotionel levering.

OpenVoice kræver typisk 6-8 GB VRAM afhængigt af batch størrelse og tone konvertering belastning. Det kører komfortabelt på mid-range til øverste mid-range GPU'er, og på TextToSpeechAI alt dette håndteres på vores servere, så du ikke har brug for nogen lokal hardware.

OpenVoice er en Ultra-tier motor, prissat til 50 kreditter pr. 1000 tegn. Ultra-niveau afspejler sin avancerede tone kontrol og den ekstra compute behov for kloning plus stil-konvertering rørledning.

OpenVoice er unik for sin tone og stil kontrol: du kan tage en klonet stemme og re-levere det som munter, trist, vred eller hvisken. F5-TTS er hurtigere og er vores standard kloning motor til naturlig, neutral tale. Vælg OpenVoice, når du har brug for følelsesmæssig stil kontrol, og F5-TTS, når du ønsker den hurtigste naturlige klon.

Opret en klonet stemme ved at uploade reference audio, derefter angive en tone stil i din API anmodning. API anvender din valgte følelsesmæssige tone til klonet stemme automatisk og returnerer lyden i MP3, WAV, eller OGG format.

Ja. Tilmeld dig en gratis TextToSpeechAI konto for at modtage startkreditter og prøv OpenVoice-kloning og tonekontrol, eller brug demoen på siden først. Der er ingen lokal opsætning - uploade et referenceklip, vælge en tone og generere i browseren.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free