Piper TTS

Standard

Text-to-speech thần kinh nhanh, nhẹ

Very Fast Tốc độ
Good Chất lượng
Không Bản sao
20 Ngôn ngữ

Về Piper TTS

ing the

Tính năng chính

Tổng hợp cực nhanh

Tạo ra giọng nói trong thời gian thực, ngay cả trên các thiết bị năng lượng thấp như Raspberry Pi.

Tối ưu hóa CPU

Chạy hiệu quả trên CPU mà không cần phần cứng GPU đắt tiền.

20+ ngôn ngữ

Hỗ trợ hơn 20 ngôn ngữ với phát âm chất lượng bản xứ.

Hoạt động ngoài mạng

Công việc hoàn toàn offline mà không cần kết nối internet.

Tư nhân trước

Tất cả các quá trình xử lý diễn ra tại địa phương - văn bản của bạn không bao giờ rời thiết bị của bạn.

Mã nguồn mở

Toàn bộ mã nguồn mở theo giấy phép MIT với phát triển cộng đồng tích cực.

Tình huống sử dụng

Trợ lý nhà thông minhName Ứng dụng hỗ trợ người khuyết tật Hệ thống điện thoại IVRName Thiết bị nhúng Phần mềm giáo dụcName Ứng dụng ngoài mạng

Piper TTS Voices

View All 101
Alan (Fast) (UK English)
EN_GB
Alan (UK English)
EN_GB
Alba (UK English)
EN_GB
Alejandro (Spanish (Mexico))
ES_MX
Amir (Persian)
FA_IR
Amy (Fast) (US English)
EN_US
Amy (US English)
EN
Anders (Danish)
DA_DK
Anna (Hungarian)
HU_HU
Arctic (US English)
EN_US
Arthur (UK English)
EN_GB
Artur (Slovenian)
SL_SI

Cách sử dụng Piper TTS

  1. 1

    Đăng ký miễn phí hoặc mở bản demo

    Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi động, hoặc sử dụng bản demo trên trang để thử Piper ngay lập tức mà không cần đăng nhập.

  2. 2

    Chọn giọng nói Piper

    Mở thư viện giọng nói và lọc theo bộ máy Piper, sau đó xem trước giọng nói trên ngôn ngữ và giọng điệu mục tiêu để tìm ra giọng nói đúng.

  3. 3

    Nhập hoặc dán văn bản của bạn

    Nhập hoặc dán văn lệnh bạn muốn nói vào hộp văn bản. Piper xử lý chấm câu và đoạn dài tốt, vì vậy bạn có thể thả vào các đoạn văn hoàn chỉnh.

  4. 4

    Điều chỉnh tốc độ và tạo

    Đặt tốc độ nói (khoảng 0. 5x đến 2. 0x) phù hợp với dự án của bạn, sau đó bấm tạo để Piper tổng hợp âm thanh trong vài giây trên CPU.

  5. 5

    Tải về âm thanh hoặc gọi API

    Tải xuống đoạn phim của bạn như MP3, WAV, hoặc OGG từ bảng kết quả, hoặc tự động hóa nó bằng cách gửi cùng một Piper voice slug đến /v1/generate/ REST endpoint.

Piper TTS API

Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Chào mừng đến Piper, một máy chuyển văn bản sang giọng nói nhanh và nhẹ.",
    "voice": "en_GB-alan-low"
  }'

Câu hỏi thường gặp

Piper là một bộ máy chuyển văn bản sang nói nhanh, nhẹ, chuyển văn bản viết thành lời nói tự nhiên. Nó sử dụng mô hình học sâu dựa trên VITS tối ưu hóa cho sự suy luận CPU hiệu quả, làm cho Piper lý tưởng cho các thiết bị rìa, công cụ không kết nối mạng, và ứng dụng thời gian thực. Bạn có thể thử Piper miễn phí trên TextToSpeechAI trực tiếp trong trình duyệt.

Có, Piper hoàn toàn miễn phí và mã nguồn mở theo giấy phép MIT, vì vậy bạn có thể sử dụng nó cho các dự án cá nhân và thương mại mà không cần trả phí giấy phép. Ở TextToSpeechAI, bạn có thể thử Piper miễn phí với các điểm bắt đầu của bạn, và sử dụng tiếp tục chỉ tốn 10 điểm cho mỗi 1000 ký tự.

Có, Piper được phát hành theo giấy phép MIT, cho phép sử dụng thương mại. Bạn có thể gửi âm thanh được tạo bởi Piper vào các sản phẩm thương mại, video, ứng dụng và dịch vụ mà không phải trả phí bản quyền hay thêm tên tác giả.

Piper hỗ trợ hơn 20 ngôn ngữ, bao gồm tiếng Anh (Mỹ, Anh và các giọng khác), tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Bồ Đào Nha, tiếng Hà Lan, tiếng Ba Lan, tiếng Nga, và nhiều ngôn ngữ khác. Mỗi ngôn ngữ có một số giọng nói Piper được đào tạo trước để chọn trong thư viện giọng nói TextToSpeechAI.

Piper là một trong những máy TTS nhanh nhất có sẵn và chạy thoải mái trên CPU. Nó có thể tổng hợp giọng nói trong thời gian thực ngay cả trên Raspberry Pi, vì vậy trên TextToSpeechAI hầu hết các yêu cầu Piper trả lại âm thanh trong ít hơn một giây.

Không, Piper không hỗ trợ sao chép giọng nói - nó chỉ dùng các mẫu giọng nói đã được huấn luyện trước. Nếu bạn cần sao chép một giọng nói cụ thể từ một mẫu, hãy dùng một bộ máy sao chép như F5- TTS hay Chatterbox trên TextToSpeechAI.

Piper tạo ra âm thanh rõ ràng, chất lượng tốt phù hợp với trợ lý, hệ thống IVR, kể chuyện và công cụ truy cập. Nó không phải là độ chính xác cao như các mẫu cao cấp chậm hơn, nhưng tỷ lệ tốc độ-chất lượng của nó là tuyệt vời cho hầu hết các trường hợp sử dụng hàng ngày.

Không cần GPU - Piper được thiết kế để chạy trên CPU và chỉ dùng vài trăm megabyte bộ nhớ. Đây là lý do tại sao Piper phù hợp với các kịch bản không kết nối và nhúng mà không cần GPU riêng.

Có, Piper được xây dựng để suy luận địa phương nhanh và chạy hoàn toàn ngoài mạng khi các mô hình giọng nói của nó được tải xuống, không cần kết nối Internet. Dấu chân nhỏ và thiết kế chỉ CPU của nó làm cho Piper là một trong những lựa chọn tốt nhất cho giọng nói ngoài mạng và trên thiết bị.

Cả Piper và Kokoro đều là những máy nhanh, thân thiện CPU, cấp độ tiêu chuẩn không có bản sao giọng nói. Piper có một thư viện giọng nói đa ngôn ngữ rất lớn và rất nhẹ, trong khi Kokoro thường nghe giống như được làm sạch hơn, vì vậy chọn Piper cho sự rộng của giọng nói và tài nguyên tối thiểu, và Kokoro khi bạn muốn giọng nói mặc định mượt hơn.

Piper là trong mức giá tiêu chuẩn, có giá 10 tín dụng cho mỗi 1000 ký tự - mức thấp nhất là TextToSpeechAI. Tài khoản mới có được tín dụng khởi đầu miễn phí, vì vậy bạn có thể thử nghiệm Piper miễn phí trước khi ký kết.

Chọn một giọng nói Piper từ thư viện giọng nói, sau đó truyền giọng nói của nó đến điểm cuối /v1/generate/ với token API của bạn. API REST tạo âm thanh và trả lại một URL tải về, và bạn có thể yêu cầu xuất MP3, WAV, hoặc OGG.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 20
  • GPU VRAM 500MB
  • Credits/1000 chars 10

Try Piper TTS Now

Generate your first audio free. No credit card required.

Start Free