Vỏ cây

Premium

Tiếng nói AI biểu cảm với cảm xúc và hiệu ứng âm thanh

Slow Tốc độ
Very Good Chất lượng
Không Bản sao
13 Ngôn ngữ

Về Vỏ cây

-text audio. Bark is a

Tính năng chính

Từ biểu cảm

Tạo ra lời nói với tiếng cười, thở dài, thở hổn hển, và cảm xúc thật sự.

Dấu cảm xúc

Dùng [cười], [thở phào], CAPS để nhấn mạnh, và... để ngần ngại.

Nhiều ngôn ngữ

Hỗ trợ 13+ ngôn ngữ với giọng nói và phát âm tự nhiên.

Nhạc & Hiệu ứng

Có thể tạo ra nhạc đơn giản và âm thanh môi trường.

Đặt sẵn loa

Nhiều giọng nói người nói được huấn luyện sẵn với nhiều phong cách khác nhau.

Mã nguồn mở

MIT licensed with full commercial use rights.

Tình huống sử dụng

Hộp thoại ký tự Nội dung hoạt hình Trình bày sách âm thanh Trò chơi Dự án sáng tạo Trợ lý biểu cảm

Vỏ cây Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Cách sử dụng Vỏ cây

  1. 1

    Đăng ký miễn phí và mở demo

    Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi đầu, hoặc dùng bản thử nghiệm không đăng ký để thử Bark ngay lập tức. Tiền thưởng miễn phí đủ để tạo ra một số đoạn phim Bark biểu cảm trước khi nâng cấp.

  2. 2

    Chọn giọng nói

    Mở thư viện giọng nói và chọn một bộ phận mở đầu mặc định phù hợp với âm thanh bạn muốn. Giọng nói mở đầu được đánh dấu là cấp cao (25 điểm cho mỗi 1000 ký tự) và được điều chỉnh cho giọng nói cảm xúc, kiểu nhân vật.

  3. 3

    Nhập văn bản với dấu cảm xúc

    Nhập văn lệnh và nhúng các dấu hiệu cảm xúc Bark vào dòng: [laughter] cho tiếng cười, [sighs] cho tiếng thở, [gasps] cho tiếng thở,... cho một đoạn ngừng, và CAPS cho sự nhấn mạnh. Ví dụ: "Oh wow! [laughter] This is AMAZING... I can' t believe it!"

  4. 4

    Tạo âm thanh

    Nhấn vào Create và Bark sẽ biến văn bản của bạn thành lời nói biểu cảm, biến mỗi dấu hiệu thành âm thanh tương ứng. Sự tạo chậm hơn các máy nhẹ vì mô hình biến đổi của Bark, vì vậy cho phép thêm vài giây cho mỗi câu.

  5. 5

    Tải xuống hoặc sử dụng API

    Xem trước kết quả, sau đó tải nó về dạng MP3, WAV, hoặc OGG. Để tự động hóa Bark trong ứng dụng của bạn, gọi API TextToSpeechAI với giọng nói Bark và cùng một văn bản có nhiều dấu hiệu để lấy lại âm thanh biểu cảm.

Vỏ cây API

Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Oh wow! [cười] Thật tuyệt vời... Tôi chỉ yêu cái âm thanh biểu cảm này!",
    "voice": "bark-zh_0"
  }'

Câu hỏi thường gặp

Bark là một mô hình chuyển văn bản sang âm thanh dựa trên biến đổi được tạo bởi Suno. Không giống như các hệ thống TTS truyền thống, Bark tạo ra giọng nói biểu cảm cao với cảm xúc tự nhiên, cười, thở dài, và các âm thanh không nói khác. Nó thậm chí có thể tạo ra âm nhạc và hiệu ứng âm thanh.

Yes, Bark is open-source under the MIT license, allowing free commercial use. On TextToSpeechAI, we charge 25 credits per 1000 characters due to the significant GPU resources required for generation.

Bark hỗ trợ 13+ ngôn ngữ bao gồm tiếng Anh, Đức, Tây Ban Nha, Pháp, Hindi, Ý, Nhật Bản, Hàn Quốc, Ba Lan, Bồ Đào Nha, Nga, Thổ Nhĩ Kỳ và Trung Quốc.

Bark chậm hơn hầu hết các máy TTS do kiến trúc biến đổi tự hồi phục của nó. Một câu thông thường mất 5- 15 giây để tạo trên GPU. Sự trao đổi là kết quả xuất ra biểu cảm và tự nhiên hơn đáng kể.

Bark chỉ cung cấp việc nhân bản giọng nói hạn chế thông qua "các yêu cầu ngữ nghĩa" và các mặc định loa, vì vậy nó không thể nhân bản một giọng nói tùy ý từ một mẫu. Nếu mục tiêu của bạn là nhân bản giọng nói toàn bộ, hãy dùng F5- TTS, StyleTTS2, OpenVoice, hoặc Tortoise thay vì vậy, tất cả đều có sẵn trên TextToSpeechAI.

Bark đọc các dấu đánh dấu trong dòng được đặt trực tiếp trong văn bản của bạn và biến chúng thành âm thanh tương ứng. Dùng [laughter] cho tiếng cười, [sighs] cho tiếng thở dài, [gasps] cho tiếng thở dài,... cho sự ngần ngại hay dừng lại, và CAPS để nhấn mạnh. Ví dụ: "Oh wow! [laughter] This is AMAZING... I can' t believe it!"

Bên cạnh lời nói đơn giản, Bark có thể tạo ra các âm thanh không nói như cười, thở dài, thở hổn hển, cổ họng sạch sẽ, và nói lắp, cộng thêm âm nhạc đơn giản và hiệu ứng môi trường. Điều này được kích hoạt với các dấu hiệu như [laughter], [sighs], và [gasps] được nhúng vào văn bản, điều này khiến Bark cảm thấy thể hiện hơn so với TTS tiêu chuẩn.

Bark tạo ra âm thanh chất lượng rất tốt với sự thể hiện tự nhiên cạnh tranh với giọng nói của con người cho nội dung cảm xúc. 24kHz xuất âm thanh chuyên nghiệp, mặc dù chất lượng giọng nói thuần túy là hơi thấp hơn StyleTTS2.

Bark yêu cầu 8-12GB VRAM tùy theo kích thước mô hình. Mô hình đầy đủ cần ~12GB, trong khi các biến thể nhỏ hơn hoạt động với 8GB. CPU suy luận là cực kỳ chậm và không được khuyến cáo.

Có, Bark được cấp phép MIT, cho phép sử dụng thương mại không giới hạn mà không cần trả phí cấp phép. Bạn có thể tự do sử dụng Bark trong sản phẩm, dịch vụ và ứng dụng. Ở TextToSpeechAI, bạn có thể thử Bark miễn phí bằng cách sử dụng tiền ghi nợ đăng ký trước khi trả tiền để mua nhiều hơn.

Bark xuất sắc trong việc nói chuyện một người với những dấu hiệu cảm xúc như [cười] và [thở phào], trong khi Dia được xây dựng cho đối thoại nhiều người với những chuyển động [S1]/[S2] và những dấu hiệu không nói. Chọn Bark cho những câu chuyện cảm xúc và giọng nói nhân vật, và Dia cho những cuộc nói chuyện đi lại. Cả hai đều có sẵn trên TextToSpeechAI.

Bark độc nhất trong khả năng tạo ra giọng nói biểu cảm thật sự với cảm xúc và âm thanh không nói. Nó chậm hơn các bộ máy khác nhưng tạo ra kết quả giống người hơn cho nội dung sáng tạo. Để tổng hợp nhanh hơn, dùng Piper. Để sao chép giọng nói, dùng F5- TTS hoặc OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Vỏ cây Now

Generate your first audio free. No credit card required.

Start Free