OpenVoice

Ultra

Instant Voice Klonen met Granular Tone Control

Moderate Snelheid
Very Good Kwaliteit
Ja. Klonen
10 Talen

Info OpenVoice

OpenVoice is een veelzijdig instant voice cloning model dat fijnkorrelige controle over sprekende stijl toelaat. In tegenstelling tot andere kloonmodellen, OpenVoice scheidt stemidentiteit van sprekende stijl, zodat u een gekloonde stem en verschillende tonen - vrolijk, verdrietig, boos, opgewonden, of fluisteren - zonder nieuwe referentie audio.

Belangrijkste kenmerken

Instant Cloon

Kloon elke stem van slechts een paar seconden van audio.

Tooncontrole

Breng vrolijk, verdrietig, boos, opgewonden of fluistertoon aan.

Stijloverdracht

Los van spraakidentiteit en spreekstijl voor flexibiliteit.

Kruislings

Gebruik gekloonde stemmen in verschillende talen.

Snelle verwerking

Efficiënte gevolgtrekking voor snelle stemgeneratie.

Bron openen

MIT-licentie voor commerciële toepassingen.

Gebruik kasten

Emotionele inhoud Tekenanimatie Interactieve spellen Audioboekvertelling Marketingvideo's Virtuele assistenten

Hoe gebruikt u dit middel? OpenVoice

  1. 1

    Gratis aanmelden of probeer de demo

    Maak een gratis TextToSpeechAI-account aan om startercredits te krijgen, of gebruik de on-page demo om OpenVoice te horen voordat je een commit. Er is geen lokale GPU of installatie nodig - alles draait op onze servers.

  2. 2

    Kies OpenVoice en upload een referentieclip

    Selecteer de OpenVoice-engine en upload vervolgens een paar seconden van het schone referentiegeluid om direct de doelstem te klonen. OpenVoice legt de luidspreker-identiteit vast zodat u deze kunt hergebruiken over elke tekst en toon.

  3. 3

    Voer uw tekst in

    Typ of plak het script dat u wilt spreken in de gekloonde stem. OpenVoice ondersteunt ongeveer 10 talen en meertalige levering, zodat u kunt schrijven in een andere taal dan de referentieclip.

  4. 4

    Kies een toonstijl en genereren

    Kies een van de negen OpenVoice-stijlen - standaard, vriendelijk, vrolijk, opgewonden, verdrietig, boos, angstig, schreeuwen of fluisteren - dan genereren. Dezelfde gekloonde stem zal spreken met die emotionele levering.

  5. 5

    Download of gebruik de API

    Download uw audio als MP3, WAV, of OGG, of automatiseer generatie via de TextToSpeechAI API door het doorgeven van uw gekloonde stem en toon stijl in elk verzoek.

OpenVoice API

Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice kan in elke toon spreken \u002D vrolijk, verdrietig, of zelfs fluisteren.",
    "voice": "en_US-lessac-medium"
  }'

Veelgestelde vragen

OpenVoice is een geavanceerd model voor tekst-tot-spraak en stemklonen dat stemidentiteit uniek van spraakstijl scheidt. Hiermee kun je een stem klonen en vervolgens verschillende emotionele tonen toepassen zonder dat je nieuwe referentiegeluiden nodig hebt voor elke emotie. Het is gebouwd voor expressieve, controleerbare spraakgeneratie.

Ja, OpenVoice voert direct voice-klonen uit vanaf slechts enkele seconden referentie audio - geen training nodig. Zodra een stem is vastgelegd, kan OpenVoice die identiteit hergebruiken over elke tekst en elke toonstijl die u selecteert.

OpenVoice maakt gebruik van een tweetraps architectuur die de basis spraaksynthese splitst van toonconversie. Na het klonen van een stem, kunt u een van de 9 toonstijlen - standaard, vriendelijk, vrolijk, opgewonden, verdrietig, boos, angstig, schreeuwen, of fluisteren - toepassen en dezelfde gekloonde stem spreekt anders op basis van uw gekozen toon zonder opnieuw op te nemen.

OpenVoice ondersteunt negen sprekende stijlen: standaard, vriendelijk, vrolijk, opgewonden, verdrietig, boos, angstig, schreeuwend en fluisterend. Elke stijl hervormt de emotionele levering met behoud van de gekloonde luidspreker identiteit, waardoor u fijnkorrelige controle over hoe een lijn wordt gelezen.

OpenVoice is open-source onder de permissieve MIT licentie, dus het is gratis voor commercieel gebruik. Net als bij elk klonen model, zorg ervoor dat u de juiste rechten op elke stem die u klonen voor commerciële projecten.

OpenVoice ondersteunt ongeveer 10 talen, waaronder Engels, Chinees, Japans, Koreaans en verschillende Europese talen. Het biedt ook cross-lingual klonen, zodat u een stem in de ene taal kunt klonen en het natuurlijk in een andere taal spreken.

OpenVoice heeft een matige generatiesnelheid, waardoor een zin in 2-4 seconden op een GPU wordt weergegeven. Outputkwaliteit is zeer goed, met duidelijke stemweergave en toonoverdracht die de luidsprekeridentiteit intact houdt terwijl de emotionele levering overtuigend verandert.

OpenVoice vereist meestal 6-8 GB VRAM afhankelijk van batchgrootte en tone conversie belasting. Het draait comfortabel op mid-range tot bovenste mid-range GPU's, en op TextToSpeechAI van dit alles wordt behandeld op onze servers, zodat u geen lokale hardware nodig.

OpenVoice is een Ultra-tier motor, geprijsd op 50 credits per 1000 karakters. De Ultra tier weerspiegelt zijn geavanceerde toonregeling en de extra rekenmethode die nodig is voor het klonen plus stijlconversie pijplijn.

OpenVoice is uniek voor zijn toon en stijl controle: u kunt een gekloonde stem en opnieuw leveren als vrolijk, verdrietig, boos, of fluisteren. F5-TTS is sneller en is onze standaard kloon motor voor natuurlijke, neutrale spraak. Kies OpenVoice wanneer u emotionele stijl controle, en F5-TTS wanneer u wilt de snelste natuurlijke kloon.

Maak een gekloonde stem door referentieaudio te uploaden en geef vervolgens een toonstijl op in uw API-verzoek. De API past uw gekozen emotionele toon automatisch toe op de gekloonde stem en geeft het geluid terug in MP3, WAV, of OGG-formaat.

Ja. Schrijf je in voor een gratis TextToSpeechAI account om starter credits te ontvangen en probeer OpenVoice klonen en tooncontrole, of gebruik eerst de demo op de pagina. Er is geen lokale setup - upload een referentieclip, kies een toon, en genereren in de browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free