กระดาษ

Premium

เสียง AI ที่มีอารมณ์และเสียงเอฟเฟกต์Name

Slow ความเร็ว
Very Good คุณภาพ
ไม่มี กำลังสร้างคอลลิน
13 ภาษา

เกี่ยวกับ กระดาษ

-text audio. Bark is the first text-to-audio model to be fully integrated into the human language. It is the first text-to-audio model to be fully integrated into the human language. Bark is the first text-to-audio model to be fully integrated into the human language. It is the first text-to-audio model to be fully integrated into the human language. Bark can

ตัวเลือกหลัก

แสดงอารมณ์

สร้างเสียงพูดด้วยเสียงหัวเราะ เสียงหายใจ เสียงหายใจลึก และอารมณ์ที่แท้จริง

เครื่องหมายอารมณ์KCharselect unicode block name

ใช้ [เสียงหัวเราะ] [ถอนหายใจ] ตัวอักษรใหญ่สำหรับเน้น และ... สำหรับการลังเล

หลายภาษา

สนับสนุนภาษามากกว่า 13 ภาษา พร้อมกับสำเนียงและการออกเสียงตามธรรมชาติ

เสียงดนตรีและลูกเล่นName

สามารถสร้างเสียงดนตรีและเสียงสภาพแวดล้อมได้

ตั้งค่าตัวเลื่อนลำโพง

เสียงพูดหลายเสียงที่ฝึกมาก่อน ด้วยสไตล์ที่แตกต่างกัน

โอเพนซอร์ส

MIT อนุมัติให้ใช้สิทธิ์ ทางการค้าเต็มที่

กรณีการใช้

กล่องอักษร เนื้อหาที่เคลื่อนไหว คำบรรยายของหนังสือเสียง เสียงของเกมName โครงการสร้างสรรค์ ตัวช่วยแสดงออกName

กระดาษ Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

วิธีการใช้ กระดาษ

  1. 1

    ลงทะเบียนฟรีและเปิดตัวอย่างเป็นทางการ

    สร้างบัญชี TextToSpeechAI ฟรี เพื่อเรียกร้องเครดิตเริ่มต้นของคุณ หรือใช้ demo ที่ไม่มีการลงทะเบียนเพื่อทดลอง Bark ตอนนี้ เครดิตฟรีเพียงพอที่จะสร้างคลิป Bark แสดงออกหลายครั้งก่อนที่คุณจะปรับปรุง

  2. 2

    เลือกเสียงของเสียง

    เปิดห้องสมุดเสียง และเลือก ตัวตั้งเสียงบรรยายแบบบรรยายเสียงที่ตรงกับเสียงที่คุณต้องการ เสียงบรรยายจะถูกแท็กเป็นระดับพิเศษ (25 เครดิตต่อ 1000 อักขระ) และถูกปรับให้เหมาะสมกับการเล่าเรื่องแบบอารมณ์และตัวละคร

  3. 3

    พิมพ์ข้อความที่ใช้เป็นเครื่องหมายอารมณ์

    Type your script and embed Bark emotion markers inline: [laughter] for laughs, [sighs] for sighs, [gasps] for gasps, ... for a pause, and CAPS for emphasis. For example: "Oh wow! [laughter] This is AMAZING... I can't believe it!"

  4. 4

    สร้างเสียง

    คลิกที่ สร้าง และ Bark จะแสดงข้อความของคุณเป็นเสียงพูดที่แสดงออกถึงความรู้สึก โดยเปลี่ยนตัวบ่งชี้แต่ละตัวเป็นเสียงที่ตรงกัน การสร้างจะช้ากว่าเครื่องจักรที่ใช้แรงน้อย เพราะว่า Bark ใช้โมเดลการเปลี่ยนรูปแบบ ดังนั้น ให้ใช้เวลาเพิ่มอีกสองสามวินาทีต่อประโยค

  5. 5

    ดาวน์โหลดหรือใช้ API

    แสดงผลลัพธ์ก่อนใช้ และดาวน์โหลดเป็น MP3, WAV หรือ OGG หากต้องการใช้ Bark แบบอัตโนมัติในแอพพลิเคชันของคุณ โปรดเรียก API TextToSpeechAI ด้วยเสียง Bark และข้อความที่มีความหมายมากๆ เช่นเดียวกัน เพื่อรับเสียงที่แสดงออกได้

กระดาษ ตัวช่วยการใช้งาน

สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "โอ้ววว นี่มันน่าทึ่งมาก ฉันรักมันมากเลย",
    "voice": "bark-zh_0"
  }'

คำถามที่ถามบ่อย

Bark เป็นโมเดลการแปลงข้อความเป็นเสียงที่ใช้เทคโนโลยีแปลงรูปแบบ (Transformer) โดย Suno ไม่เหมือนกับระบบ TTS แบบดั้งเดิม Bark สามารถสร้างเสียงที่แสดงออกได้ดีด้วยอารมณ์ตามธรรมชาติ เช่น เสียงหัวเราะ เสียงถอนหายใจ และเสียงอื่น ๆ ที่ไม่ใช้คำพูด มันยังสามารถสร้างดนตรีและเอฟเฟกต์เสียงได้อีกด้วย

Yes, Bark is open-source under the MIT license, allowing free commercial use. On TextToSpeechAI, we charge 25 credits per 1000 characters due to the significant GPU resources required for generation.

Bark รองรับภาษามากกว่า 13 ภาษา รวมถึงภาษาอังกฤษ เยอรมัน สเปน ฝรั่งเศส ฮินดี อิตาลี ญี่ปุ่น เกาหลี โปแลนด์ โปรตุเกส รัสเซีย ตุรกี และจีน ทุกภาษามีการออกเสียงและสำเนียงตามธรรมชาติ

Bark ใช้เวลาช้ากว่ากลไก TTS ส่วนใหญ่ เพราะใช้โครงสร้างของการเปลี่ยนแปลงแบบอัตโนมัติ ประโยคทั่วไปใช้เวลา 5- 15 วินาทีในการสร้างบน GPU ด้วยการแลกเปลี่ยนผลลัพธ์ที่แสดงออกและเป็นธรรมชาติมากขึ้น

Bark เสนอการโคลนเสียงที่จำกัดเพียงแค่ "คำสั่งเชิงความหมาย" และตัวตั้งตัวเล่าเสียง ดังนั้น มันจะไม่สามารถโคลนเสียงที่ไม่ถูกต้องจากตัวอย่างได้ หากคุณต้องการโคลนเสียงเต็มที่ ให้ใช้ F5- TTS, StyleTTS2, OpenVoice หรือ Tortoise แทน ซึ่งทั้งหมดนี้มีให้ใช้บน TextToSpeechAI

Bark จะอ่านตัวกำหนดบรรทัดที่วางไว้ในข้อความของคุณโดยตรง และเปลี่ยนมันเป็นเสียงที่ตรงกัน ใช้ [laughter] สำหรับเสียงหัวเราะ [sighs] สำหรับเสียงถอนหายใจ [gasps] สำหรับเสียงหายใจลึกๆ... สำหรับความลังเลหรือการหยุดชะงัก และใช้ตัวอักษรใหญ่เพื่อเน้นเสียง ตัวอย่าง: "โอ้ ว้าว! [laughter] นี่มันมหัศจรรย์... ฉันไม่อยากเชื่อเลย!"

นอกเหนือจากการพูดธรรมดา Bark สามารถสร้างเสียงที่ไม่ใช้คำพูดได้ เช่น เสียงหัวเราะ เสียงหายใจลึกๆ เสียงหายใจลึกๆ เสียงลำคอแตก และเสียงหอบหืด รวมถึงเสียงดนตรีและเอฟเฟกต์สภาพแวดล้อม สิ่งเหล่านี้จะถูกกระตุ้นด้วยตัวบ่งชี้ เช่น [หัวเราะ], [หายใจลึกๆ] และ [หอบหืด] ที่ถูกฝังอยู่ในข้อความ ซึ่งเป็นสิ่งที่ทำให้ Bark รู้สึกว่าแสดงออกได้ดีกว่า TTS แบบมาตรฐาน

Bark ผลิตเสียงที่มีคุณภาพดีมาก ๆ ด้วยการแสดงออกตามธรรมชาติที่แข่งขันกับการพูดของมนุษย์ในเรื่องของเนื้อหาอารมณ์ ผลลัพธ์ 24kHz เสียงเป็นมืออาชีพ, แม้ว่าคุณภาพของการพูดบริสุทธิ์จะต่ำกว่า StyleTTS2 เพียงเล็กน้อย

Bark ต้องการ VRAM 8-12GB ขึ้นอยู่กับขนาดของโมเดล โมเดลเต็มๆ ต้องการ ~12GB ในขณะที่โมเดลเล็กๆ ใช้ได้กับ 8GB การคำนวณ CPU นั้นช้ามาก และไม่แนะนำให้ใช้

Yes, Bark is MIT licensed, which permits unrestricted commercial use with no licensing fees. You can use Bark in products, services, and applications freely. On TextToSpeechAI you can try Bark free using your signup credits before paying for more.

Bark มีความสามารถในการแสดงออกในภาษาที่พูดโดยผู้พูดคนเดียว ด้วยเครื่องหมายอารมณ์ เช่น [หัวเราะ] และ [ถอนหายใจ] ในขณะที่ Dia ถูกสร้างขึ้นเพื่อการสนทนาของผู้พูดหลายคน ด้วยการเปลี่ยน [S1] / [S2] และคำแนะนำที่ไม่ใช้คำ เลือก Bark สำหรับคำบรรยายอารมณ์และเสียงตัวละคร และ Dia สำหรับการสนทนาแบบกลับไปกลับมา ทั้งหมดนี้มีอยู่ใน TextToSpeechAI

Bark มีคุณสมบัติเฉพาะตัวในการสร้างเสียงที่แสดงออกถึงอารมณ์และเสียงที่ไม่ใช้คำพูด มันช้ากว่ากลไกอื่น ๆ แต่สร้างผลลัพธ์ที่คล้ายกับมนุษย์มากขึ้นสำหรับเนื้อหาที่สร้างสรรค์ หากต้องการสังเคราะห์เสียงเร็วขึ้น ให้ใช้ Piper หากต้องการโคลนเสียง ให้ใช้ F5- TTS หรือ OpenVoice

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try กระดาษ Now

Generate your first audio free. No credit card required.

Start Free