孔晶蒸二

Premium

支持流流支持的零弹式多语种语音克隆

Fast 速度
Very Good 质量
克隆
5 语文

关于 孔晶蒸二

CosyVoice2 是FunAudioLLM (Alibaba) 的下一代语音合成模型。 它提供具有低延度应用流能力的、跨多种语言的自然声音零弹式克隆。 它以有限的天平量化方法构建,它以几秒钟的参考音频实现极佳的语音相似性。

关键关键特征

零热声音克隆

以高度忠诚的方式 开启3 -10秒的音频

多种语文

支持中文、英文、日文、韩文和广东文的跨语言合成。

流流支持支持

实时应用程序和互动系统的低时空流模式。

自然状态

先进的前代代言模式 产生自然声音的演讲 与适当的内涵。

使用案例

多语言内容创建 实时语音助理 跨语言词汇 个个化语音应用程序

如何使用 孔晶蒸二

  1. 1

    注册并申请免费信贷

    创建一个免费的 TextToSpeechAI 账户来申请您的启动贷款, 或者先试演示。 不需要 GPU 或本地 CosyVoice2 安装, 所有的功能都在我们的基础设施上运行 。

  2. 2

    选择 CosyVoice2 并添加引用剪贴

    选择 CosyVoice2 做为您的引擎, 然后上传一个干净的 3 - 10 秒引用音频的音频记录。 CosyVoice2 将提取用于零弹多语言克隆的语句特性 。

  3. 3

    输入任何支持语言的文本

    使用中文、英文、日文、韩文或广东文键,键入或粘贴您的脚本。 CosyVoice2 支持跨语言合成, 以便克隆声音可以使用不同于参考剪辑的语言。

  4. 4

    生成演讲

    点击生成并合成 CosyVoice2 以克隆声音合成自然多语种语言, 通常在短文本的几秒内。 优先级使用成本为每千个字符25分。

  5. 5

    下载或使用 API

    从您的历史中下载完成的 MP3 或 WAV 音频,或者通过 TextToSpeechAI REST API 大规模自动化 CosyVoice2 语音克隆 。

孔晶蒸二 API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI

以TextToSpeechAIREST API 生成有计划的语言。

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 提供自然多语言演讲,具有零发音克隆能力。",
    "voice": "en_US-lessac-medium"
  }'

常问问题

CosyVoice2 是FunAudiolLM (Alaba) 的下一代文字语音克隆模型。 它支持仅几秒钟的参考音频零光语音克隆, 并且可以合成中文、 英文、 日文、 韩文和广东文的自然语言。 TextToSpeechAI 时, 您可以在浏览器上运行 CosyVoice2, 无需设置本地设置 。

是的,CosyVoice2是全阿帕奇2.0的许可使用,包括代码和模型重量。 这使得在商业产品、有偿内容和客户工作中使用安全,无需许可证费或非商业限制。

CosyVoice2 支持五种语言: 中文( 普通语言 ) 、 英语、 日语、 韩语和广东话。 它也处理跨语言合成, 这样您就可以从一种语言的录音中克隆一个声音, 并在另一种语言中生成语言 。

CosyVoice2使用有限的天平量度方法提取发言者的特性,然后在任何支持的语言中以克隆声音生成新的语音,不需要示范培训或微调。

CosyVoice2是更强大的多语言克隆模式之一,即使在用与参考剪辑不同的语言发声时,也保留了发言者的身份,它产生自然的手动和诱导,因此非常适合跨语言调和和本地化内容。

是的。 CosyVoice2 是一个快速模型,包含一种流模式,它能产生低潜伏的音频,适合语音助理和互动应用程序。在TextToSpeechAI代人中,通常以秒完成短文本。

CosyVoice2 需要大约 4-6GB 的 VRAM 用于 0.5B 参数模型, 因此当自我托管时建议使用 6GB 或 6GB 以上的 GPU。 在 TextToSpeechAI 上, 该模型运行在我们的 GPU 基础设施上, 因此您不需要任何硬件 。

CosyVoice2 是一种高价模式,每1,000个文字字符要花费25个信用额度。 每个新账户都获得免费启动信用额度,这样你可以在决定支付计划之前尝试CosyVoice2 语音克隆。

这两种语言都是高档语音克隆引擎。 GPT- SoVITS 通常都达到单一目标声音的最原始相似性,而 CosyVoice2 则更适合多语种和跨语言克隆,并增加了一种低时长流模式。 当您需要克隆一种声音来使用多种语言时,请选择 CosyVoice2 。

这两种语言都提供高质量的零声克隆。 CosyVoice2支持更多的语言(5对2),并增加了实时使用流,而F5-TTS对于只用英语的工作量则可以略快一些。 对于多语言项目CosyVoice2通常更合适。

TextToSpeechAI 允许您以 MP3 和 WAV 等通用格式导出 CosyVoice2 代。 您可以直接从历史页面下载文件, 或者通过 TextToSpeechAI API 程序检索文件 。

是的。 您可以在TextToSpeechAI上测试 CosyVoice2, 免费演示和免费启动分数, 无需安装任何设备。 只要签名、 上传一个简短的参考剪辑、 输入您支持的语言文本, 并生成 。

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try 孔晶蒸二 Now

Generate your first audio free. No credit card required.

Start Free