OpenVoice

Ultra

Ký âm thanh ngay lập tức với điều khiển âm thanh phân tử

Moderate Tốc độ
Very Good Chất lượng
Có chứ. Bản sao
10 Ngôn ngữ

Về OpenVoice

of the voice and apply it to the speaking style. OpenVoice is a powerful voice clone model that allows you to clone voices from a

Tính năng chính

Ký ức

Sao chép bất kỳ giọng nói nào chỉ từ vài giây âm thanh.

Điều khiển âm sắc

Ứng dụng vui vẻ, buồn bã, giận dữ, phấn khích, hoặc tiếng nói thầm.

Chuyển đổi phong cách

Tách biệt danh tính giọng nói từ phong cách nói để linh hoạt.

Cross- Language

Dùng giọng nói nhân bản trên nhiều ngôn ngữ khác nhau.

Xử lý nhanh

Thuyết phục hiệu quả cho sự sinh ra giọng nói nhanh chóng.

Mã nguồn mở

MIT cấp phép cho ứng dụng thương mại.

Tình huống sử dụng

Nội dung cảm xúc Chỉnh sửa Trò chơi tương tácName Trình bày sách âm thanh Video tiếp thị Trợ lý ảoName

Cách sử dụng OpenVoice

  1. 1

    Đăng ký miễn phí hoặc thử bản demo

    Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi đầu, hoặc sử dụng bản demo trên trang để nghe OpenVoice trước khi gửi. Không cần GPU cục bộ hay cài đặt - mọi thứ chạy trên máy chủ của chúng tôi.

  2. 2

    Chọn OpenVoice và tải lên đoạn trích tham khảo

    Chọn cơ chế OpenVoice, sau đó tải lên vài giây âm thanh tham chiếu sạch để nhân bản giọng nói mục tiêu ngay lập tức. OpenVoice thu nhận danh tính người nói để bạn có thể tái sử dụng nó trong bất kỳ văn bản và âm thanh nào.

  3. 3

    Nhập văn bản

    Nhập hoặc dán văn lệnh bạn muốn nói trong giọng nói nhân bản. OpenVoice hỗ trợ khoảng 10 ngôn ngữ và giao tiếp đa ngôn ngữ, vì vậy bạn có thể viết bằng ngôn ngữ khác với đoạn phim tham chiếu.

  4. 4

    Chọn kiểu âm và tạo

    Chọn một trong chín kiểu âm OpenVoice - mặc định, thân thiện, vui vẻ, phấn khích, buồn, tức giận, sợ hãi, hét lên, hay thì thầm - rồi tạo ra. Giọng nói nhân bản tương tự sẽ nói với sự truyền đạt cảm xúc đó.

  5. 5

    Tải xuống hoặc sử dụng API

    Tải về âm thanh của bạn như MP3, WAV, hoặc OGG, hoặc tự động tạo ra thông qua API TextToSpeechAI bằng cách truyền giọng nói và phong cách âm thanh nhân bản của bạn trong mỗi yêu cầu.

OpenVoice API

Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice có thể nói bằng bất kỳ giọng nào \u002D vui vẻ, buồn, hoặc thậm chí là thì thầm.",
    "voice": "en_US-lessac-medium"
  }'

Câu hỏi thường gặp

OpenVoice là một mô hình văn bản- sang- nói và sao chép giọng nói tiên tiến, tách biệt độc nhất tính chất giọng nói từ phong cách nói. Điều này cho phép bạn sao chép giọng nói và sau đó áp dụng những âm thanh cảm xúc khác nhau mà không cần âm thanh tham chiếu mới cho mỗi cảm xúc. Nó được xây dựng cho việc tạo giọng nói biểu cảm, có thể kiểm soát.

Vâng, OpenVoice thực hiện sao chép giọng nói ngay lập tức chỉ từ vài giây âm thanh tham chiếu - không cần chạy tập luyện. Khi giọng nói được thu, OpenVoice có thể tái sử dụng tính chất đó trong bất kỳ văn bản và kiểu âm thanh nào bạn chọn.

OpenVoice sử dụng một kiến trúc hai giai đoạn chia tách tổng hợp nói cơ bản từ chuyển đổi âm thanh. Sau khi nhân bản giọng nói, bạn có thể áp dụng bất kỳ một trong 9 kiểu giọng nói - mặc định, thân thiện, vui vẻ, phấn khích, buồn, tức giận, sợ hãi, hét lên, hay thì thầm - và giọng nói nhân bản tương tự nói khác nhau dựa trên âm thanh bạn chọn mà không cần ghi lại.

OpenVoice hỗ trợ chín phong cách nói: mặc định, thân thiện, vui vẻ, phấn khích, buồn, tức giận, sợ hãi, hét lên và thì thầm. Mỗi phong cách tái tạo lại cảm xúc trong khi giữ nguyên bản sắc người nói, cho bạn kiểm soát chi tiết cách đọc một dòng.

OpenVoice là mã nguồn mở theo giấy phép MIT, vì vậy nó miễn phí cho sử dụng thương mại. Như với bất kỳ mô hình sao chép nào, hãy chắc chắn rằng bạn có quyền sử dụng đúng đắn cho bất kỳ giọng nói nào bạn sao chép cho các dự án thương mại.

OpenVoice hỗ trợ khoảng 10 ngôn ngữ bao gồm tiếng Anh, Trung Quốc, Nhật Bản, Hàn Quốc, và một số ngôn ngữ châu Âu. nó cũng cung cấp clone cross-language, vì vậy bạn có thể clone một giọng nói trong một ngôn ngữ và có nó nói tự nhiên trong một ngôn ngữ khác.

OpenVoice có tốc độ sinh ra trung bình, thường tạo ra một câu trong 2-4 giây trên GPU. Chất lượng xuất rất tốt, với sự tái tạo giọng nói rõ ràng và chuyển đổi âm thanh giữ cho người nói giữ nguyên trong khi thay đổi thuyết phục sự chuyển giao cảm xúc.

OpenVoice thường yêu cầu 6- 8GB VRAM tùy thuộc vào kích thước gói và tải chuyển đổi âm thanh. Nó chạy thoải mái trên GPU trung bình đến trung bình cao, và trên TextToSpeechAI tất cả những điều này được xử lý trên máy chủ của chúng tôi vì vậy bạn không cần bất kỳ phần cứng cục bộ nào.

OpenVoice là một máy Ultra-tier, giá 50 credits per 1000 characters. The Ultra tier reflects its advanced tone control and the extra compute needed for the clone plus style-conversion pipeline.

OpenVoice độc nhất về kiểm soát giọng và phong cách: bạn có thể lấy một giọng nói nhân bản và tái tạo nó như vui vẻ, buồn, tức giận, hay thì thầm. F5- TTS nhanh hơn và là động cơ nhân bản mặc định của chúng tôi cho giọng nói tự nhiên, trung lập. Chọn OpenVoice khi bạn cần kiểm soát phong cách cảm xúc, và F5- TTS khi bạn muốn nhân bản tự nhiên nhanh nhất.

Tạo một giọng nói nhân bản bằng cách tải lên âm thanh tham chiếu, sau đó chỉ ra một kiểu âm trong yêu cầu API của bạn. API sẽ tự động áp dụng âm thanh cảm xúc mà bạn chọn vào giọng nói nhân bản và trả lại âm thanh theo định dạng MP3, WAV, hoặc OGG.

Đúng. Đăng ký một tài khoản TextToSpeechAI miễn phí để nhận tiền khởi đầu và thử bản sao OpenVoice và điều khiển âm thanh, hoặc dùng bản thử nghiệm trên trang trước. Không có cài đặt cục bộ - tải lên đoạn trích tham khảo, chọn âm thanh, và tạo trong trình duyệt.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free