Otwórz głos
UltraKlonowanie głosu natychmiastowego z kontrolą tonów granularnych
O tematie Otwórz głos
OpenVoice to wszechstronny model klonowania głosu, który pozwala na doskonale ziarna kontrola nad stylem mowy. W przeciwieństwie do innych modeli klonowania, OpenVoice oddziela tożsamość głosu od stylu mowy, pozwalając na klonowanie głosu i nakładanie różnych tonów - wesele, smutne, wściekłe, podekscytowane, lub szepcze - bez nowego odnośnika audio.
Kluczowe cechy
Klonowanie natychmiastowe
Klonuj głos z tylko kilku sekund audio.
Kontrola tonu
Nakładaj radosne, smutne, złe, podekscytowane lub szeptujące tony.
Przeniesienie stylu
Oddziel tożsamość głosu od stylu mowy dla elastyczności.
Krzyżowy język
Użyj sklonowanych głosów w różnych językach.
Szybkie przetwarzanie
Skuteczne wyniki dla szybkiego generowania głosu.
Otwarte źródło
MIT licencja do zgłoszeń handlowych.
Przypadki użytkowania
Jak stosować lek Otwórz głos
-
1
Zarejestruj się za darmo lub spróbuj demo
Stwórz bezpłatne konto TextToSpeechAI, aby uzyskać kredyty starterowe, lub użyj demo na stronie, aby usłyszeć OpenVoice przed złożeniem. Nie jest potrzebny lokalny GPU lub instalacja - wszystko działa na naszych serwerach.
-
2
Wybierz OpenVoice i wyślij klip referencyjny
Wybierz silnik OpenVoice, następnie prześlij kilka sekund czystego odnośnika audio, aby natychmiast sklonować głos docelowy. OpenVoice przechwyca tożsamość głośnika, tak aby można go ponownie wykorzystać w dowolnym tekście i tonie.
-
3
Wpisz tekst
Wpisz lub wklej skrypt, który chcesz wypowiedzieć w sklonowanym głosie. OpenVoice obsługuje około 10 języków i dostawę krzyżową, tak że możesz pisać w innym języku niż klip referencyjny.
-
4
Wybierz styl tonu i wygeneruj
Wybierz jeden z dziewięciu stylów tonu OpenVoice - domyślny, przyjazny, wesely, podekscytowany, smutny, zły, przerażony, krzyczący, lub szepczący - a następnie generuj. Ten sam głos klonowany będzie mówić z tym emocjonalnym dostawą.
-
5
Pobierz lub użyj API
Pobierz dźwięk jako MP3, WAV, lub OGG, lub automatyzuj generację przez TextToSpeechAI API, przekazując sklonowany głos i styl tonu w każdym z wymagań.
Otwórz głos API
Generuj mowy w programie, używając TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Otworzony głos mówi w każdym tonie \u002D wesoły, smutny, a nawet szepczący.",
"voice": "en_US-lessac-medium"
}'
Często zadawane pytania
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50