Chinese 声音

Q: 有多少大赦国际的声音可供使用?

TTS.ai 提供100+ AI 的全方位声音,覆盖24个文本到语音模式。 声音涉及多种语言、性别、口音和语言风格。 随着我们扩展我们的模范图书馆,新声音会经常被添加。

Q: 在使用这些声音之前,我可以预览一下声音吗?

是的, 许多声音都有声音预览, 您可以在此页面上直接监听。 单击任何带有预览声音的播放按钮旁边的播放按钮可以听到样本。 您也可以用自己的文本测试文本到语音页面中的任何声音 。

Q: 我如何用语言或性别过滤声音?

使用页面顶端的过滤器控制来按模型、语言或性别缩小声音。 您可以将过滤器组合起来, 找到您需要的声音 — — 例如, Kokoro模式中的女性英语声音。

Q: 自由,标准,和溢价的声音之间有什么区别?

自由声音( Kokoro, Piper, VITS, MelotTS) 不需要任何字符。 标准声音( Bark, CosyVoice 2, Dia) 使用 2x 字符。 优先声音( Chatterbox, Tortoise) 使用 4x 字符, 并提供最高品质的字符 。

Q: 哪一种声音听起来最自然?

Kokoro(免费级)在质量上被评为5/5,是最自然的免费选项。 对于溢价质量,Chatterbox和Tortoise提供了特殊的自然性,配有语音克隆支持。听听预览以判断哪个声音最适合您的需求。

Q: 我能创造我自己的自定义声音吗?

是的,使用我们的语音克隆工具从仅5-30秒的参考音频中创建自定义声音。 克隆声音出现在您的账户“我的声音”下,可以重新用于未来几代人的文字语音。

Q: 我如何为我的计划选择正确的声音?

考虑一下您的用法: 对于音频书籍, 选择像巴克或聊天盒那样的表达式声音。 对于应用程序和 IVR, 从 Kokoro 或MelotTS 中选择清晰的声音。 对于多语种内容, 请使用 CosyVoice 2 或 GPT- SoVITS 。 预览几种选项以找到最合适的选项 。

浏览 Chinese AI 预览、比较和产生演讲

282+ 声音

特别声音

Chinese

OpenVoice

[Translation temporarily unavailable. Please try again.] Chinese Neutral

使用

AI Model的呼声

每种TTS模型都有自己独特的声音组。有些模型支持语音克隆,允许你使用任何声音作为参考。

Bark 2 声音标准

尝试模型

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Chinese Speaker 1

Chinese

使用

Chinese Speaker 2

Chinese

使用

Bark Small 1 声音标准

尝试模型

Lighter version of Bark with faster inference and lower memory usage.

Chinese Speaker

Chinese

使用

CosyVoice 2 2 声音标准

尝试模型

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Chinese Female

Chinese

使用

Chinese Male

Chinese

使用

CosyVoice3 2 声音标准

尝试模型

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Chinese Female

Chinese

使用

Chinese Male

Chinese

使用

Darwin TTS 1 声音标准

尝试模型

Cross-modal Qwen3-TTS variant with FFN weights blended from the Qwen3-1.7B language model for sharper multilingual cloning.

Default (Chinese)

Chinese

使用

GPT-SoVITS 1 声音标准

尝试模型

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Default

Chinese

使用

IndexTTS-2 1 声音标准

尝试模型

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Chinese Default

Chinese

使用

Kokoro 4 声音自由

尝试模型

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Xiaobei

Chinese

使用

Xiaoni

Chinese

使用

Xiaoxiao

Chinese

使用

Yunjian

Chinese

使用

MeloTTS 1 声音自由

尝试模型

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Chinese

使用

Ming-Omni TTS 1 声音自由

尝试模型

Compact 0.5B omni-modal speech model from inclusionAI with high-fidelity 44.1kHz output and zero-shot voice cloning.

Default (Chinese)

Chinese

使用

MOSS-TTS Nano 1 声音标准

尝试模型

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

Chinese

使用

MOSS-TTSD 1 声音标准

尝试模型

Multi-speaker dialogue continuation model — generate podcast-style conversations with up to 5 speakers and 60 minutes of coherent audio.

Default (Chinese)

Chinese

使用

OpenVoice 1 声音 [Translation temporarily unavailable. Please try again.]

尝试模型

Instant voice cloning with granular control over style, emotion, and accent.

Chinese

使用

Piper 1 声音自由

尝试模型

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Huayan (Chinese)

Chinese

使用

Qwen3 TTS 1 声音标准

尝试模型

Alibaba's multilingual TTS with preset voices and voice design from text.

Uncle Fu

Chinese

使用

Spark TTS 1 声音标准

尝试模型

Voice cloning TTS with controllable emotion and speaking style via prompts.

Chinese Default

Chinese

使用

VibeVoice 2 声音标准

尝试模型

Microsoft's multi-speaker long-form TTS generating up to 90 minutes with 4 distinct speakers.

Speaker 1 (Chinese)

Chinese

使用

Speaker 2 (Chinese)

Chinese

使用

VoxCPM 1 声音标准

尝试模型

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

Default Chinese

Chinese

使用

理解大赦国际的呼声

音质标量

TTS.ai在三个质量层次上提供声音。来自Piper、VITS和MelotTS的自由级声音免费提供快速、优质的合成。来自Kokoro和CosyVoice 2等模型的标准级声音提供了更自然的流体和情感。来自OpenVoice、Chatterbox和StysteleTTS 2的优先级声音提供了开放源代码 TTS中最现实、人性化的演讲。

多语言之声

许多声音支持多种语言。某些模式,如CosyVoice 2 和 GPT-SOVITS 支持跨语言合成, 接受过一种语言培训的语音可以用另一种语言自然说话。上面的语言过滤器可以让您找到本地支持您目标语言的声音, 确保最佳发音和读音。

语音克隆

有些模型支持语音克隆,这意味着你可以使用任何声音作为参考来创建听起来像那个人的演讲。上传一个简短的音频样本( 10- 30 秒 ), 模型将适应与声音特征匹配。支持克隆的模型包括GPT- SoVITS、 CosyVoice 2 和 Chatterbox。

选择右声

最佳声音取决于您的使用案例。对于音频书籍和播客, 使用自然流传的优异声音。对于游戏字符, 探索不同模式的不同声音。对于无障碍和屏幕阅读器, 选择清晰、速度快的声音。对于快速原型, 自由级的声音可以提供即时结果, 无需信用成本。在做出选择之前, 用播放按钮预览每个声音。

文字到语言发言

Arabic Assamese Bengali Bulgarian Catalan Chinese (Mandarin) Czech Danish Dutch English Finnish French Georgian German Greek Gujarati Hindi Hungarian Icelandic Italian Japanese Kannada Kazakh Korean Latvian Luxembourgish Malayalam Marathi Nepali Norwegian Odia Persian Polish Portuguese Punjabi Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Tamil Telugu Thai Turkish Ukrainian Vietnamese Welsh

AI Model的呼声

Bark Bark Small Chatterbox Chatterbox Turbo CosyVoice 2 CosyVoice3 Darwin TTS Dia TTS GPT-SoVITS IndexTTS-2 Indic Parler TTS Kani TTS 2 KhanomTan TTS Kitten TTS Kokoro MOSS-TTS Nano MOSS-TTSD MeloTTS Ming-Omni TTS NAMAA Saudi TTS OpenVoice Orpheus OuteTTS Parler TTS Piper Pocket TTS Qwen3 TTS Sesame CSM Spark TTS StyleTTS 2 Tortoise TTS VITS VibeVoice VieNeu-TTS-v2 VoxCPM

常问问题

TTS.ai 提供100+ AI 的全方位声音,覆盖24个文本到语音模式。声音涉及多种语言、性别、口音和语言风格。随着我们扩展我们的模范图书馆,新声音会经常被添加。

是的, 许多声音都有声音预览, 您可以在此页面上直接监听。单击任何带有预览声音的播放按钮旁边的播放按钮可以听到样本。您也可以用自己的文本测试文本到语音页面中的任何声音。

使用页面顶端的过滤器控制来按模型、语言或性别缩小声音。您可以将过滤器组合起来, 找到您需要的声音 — — 例如, Kokoro模式中的女性英语声音。

自由声音( Kokoro, Piper, VITS, MelotTS) 不需要任何字符。标准声音( Bark, CosyVoice 2, Dia) 使用 2x 字符。优先声音( Chatterbox, Tortoise) 使用 4x 字符, 并提供最高品质的字符。

Kokoro(免费级)在质量上被评为5/5,是最自然的免费选项。对于溢价质量,Chatterbox和Tortoise提供了特殊的自然性,配有语音克隆支持。听听预览以判断哪个声音最适合您的需求。

是的,所有的声音都可以在商业上使用。我们的模型使用开放源码许可证(MIT, Apache 2. 0 )。生成的音频可以用于视频、播客、应用程序、游戏和其他商业应用。

我们的语音图书馆包括30+种语言,包括英文、西班牙文、法文、德文、意大利文、葡萄牙文、中文、日文、韩文、阿拉伯文、俄文、印地文、荷兰文、波兰文、土耳其文等。

是的,使用我们的语音克隆工具从仅5-30秒的参考音频中创建自定义声音。克隆声音出现在您的账户“我的声音”下,可以重新用于未来几代人的文字语音。

考虑一下您的用法: 对于音频书籍, 选择像巴克或聊天盒那样的表达式声音。对于应用程序和 IVR, 从 Kokoro 或MelotTS 中选择清晰的声音。对于多语种内容, 请使用 CosyVoice 2 或 GPT- SoVITS 。预览几种选项以找到最合适的选项。

是的,一些模型提供了口音品种。MelotTS提供了美国、英国、印度和澳大利亚的英语口音。其他模型有西班牙语、法语、葡萄牙语和中文的区域语音变体。通过语言过滤来探索口音选项。

是的,所有声音都可以通过我们的REST API获得。请在您的 API 请求中指定模式和声音识别符, 以便用程序生成任何声音的演讲。请参看我们的 API 文件页面, 查看代码示例和声音识别参考符。

随着我们整合更多的TTS模式和扩大现有模式,我们经常增加新的声音。跟踪我们的最新消息,不断了解新声音的添加、模式改进和语言扩展。

记录、增强和变声

使用全套 AI 音频工具的语音录音器。克隆你的声音, 抄写语言, 提高质量等等。

签署自由尝试文本到语音

Chinese 声音

特别声音

AI Model的呼声

Bark 2 声音 标准

Bark Small 1 声音 标准

CosyVoice 2 2 声音 标准

CosyVoice3 2 声音 标准

Darwin TTS 1 声音 标准

GPT-SoVITS 1 声音 标准

IndexTTS-2 1 声音 标准

Kokoro 4 声音 自由

MeloTTS 1 声音 自由

Ming-Omni TTS 1 声音 自由

MOSS-TTS Nano 1 声音 标准

MOSS-TTSD 1 声音 标准

OpenVoice 1 声音 [Translation temporarily unavailable. Please try again.]

Piper 1 声音 自由

Qwen3 TTS 1 声音 标准

Spark TTS 1 声音 标准

VibeVoice 2 声音 标准

VoxCPM 1 声音 标准

理解大赦国际的呼声

音质标量

多语言之声

语音克隆

选择右声

文字到语言发言

AI Model的呼声

常问问题

有多少大赦国际的声音可供使用?

在使用这些声音之前,我可以预览一下声音吗?

我如何用语言或性别过滤声音?

自由,标准,和溢价的声音之间有什么区别?

哪一种声音听起来最自然?

我能用这些声音做商业项目吗?

语音图书馆支持哪些语言?

我能创造我自己的自定义声音吗?

我如何为我的计划选择正确的声音?

有不同口音的声音吗?

我能通过API使用声音吗?

增加新声音的频率是多少?

记录、增强和变声

Bark 2 声音标准

Bark Small 1 声音标准

CosyVoice 2 2 声音标准

CosyVoice3 2 声音标准

Darwin TTS 1 声音标准

GPT-SoVITS 1 声音标准

IndexTTS-2 1 声音标准

Kokoro 4 声音自由

MeloTTS 1 声音自由

Ming-Omni TTS 1 声音自由

MOSS-TTS Nano 1 声音标准

MOSS-TTSD 1 声音标准

Piper 1 声音自由

Qwen3 TTS 1 声音标准

Spark TTS 1 声音标准

VibeVoice 2 声音标准

VoxCPM 1 声音标准