免费AI 免费AI 文本到语音
33+ 开放源模式, 273+ 声音, 33+ 不需要账户。
呼声AI需要的一切
30+ 由开放源码AI 模型驱动的工具
33+ AI 声音模型
在一个平台最全面地收集开放源代码 TTS 模型
Kokoro 自由
Kokoro是一个8200万个参数文本到语音模型,大大高于其重量级。 尽管其体积小,但它能产生非常自然和直言不讳的演讲。 Kokoro支持多种语言,包括英语、日语、中文和韩语,并有各种表达声音。 它的运行速度非常快 — — 在GPU上生成的音频速度比实时速度快近100倍。
最佳用于: 高质量的TTTS,最短的延迟、流流应用
尝试自由
Piper 自由
Piper是由Rhasspy开发的轻量级文本到语音引擎,它使用VITS和Lalynx结构。它完全在CPU上运行,对边缘设备、家庭自动化和需要离线 TTS 的应用程序来说是理想的。 Piper有超过100个超过30种语言的语音,即使以Raspberry Pi 4 的实时速度,它也以实时速度提供自然声音。
最佳用于: 快速预览、可访问性和嵌入应用程序
尝试自由
VITS 自由
VITS(对终端至终端文字到语音的对抗性学习的变化性推断)是一种平行的终端至终端TTS方法,比目前的两阶段模型产生更自然的音频,采用变式推论,辅之以正常流动和对抗性培训过程,使自然性得到显著改善。
最佳用于: 具有自然流动作用的普通用途文字对文字的语音
尝试自由
MeloTTS 自由
MyShell.ai的MelotTS是一个多语言的TTS图书馆,支持英语(美国、英国、印度、澳大利亚)、西班牙语、法语、中文、日语和韩语。它非常快,仅以近实时速度处理CPU的文本。MelotTS是为生产用途设计的,支持CPU和GPU的推理。
最佳用于: 需要快速、多语言TTS的生产应用
尝试自由
Kani TTS 2 自由
NineNineSix的Kani-TTS-2是一个超轻重量400M参数模型,它以液态AI LFM2主干线和NVIDIA NanoCoDece为基础,仅运行于3GB VRAM,在A100(RTF 0.2)2秒后产生~10秒的语音,目前公共放行船只只使用英语的`kani-ts-2-en'检查站,并不暴露语音克隆所需的语音组合钩——使用聊天盒/索引TTS2/F5-TTS进行克隆,或用Kokororo/MelotTS进行非英语克隆。
最佳用于: 低 VRAM 硬件快速英文一代,快速预览
尝试自由
OuteTTS 自由
外部TTS 扩展了具有文本到语音能力的大型语言模型, 同时保存原始结构 。 它支持多个后端, 包括 lama. cpp (CPU/GPU) 、 Huggging Face 变换器、 ExLlamaV2、 VLLM, 甚至浏览器通过变换器推导。 js. 通过以 JSON 保存的语句描述, 功能为零光语音克隆 。
最佳用于: 边缘部署、基于浏览器的TTTS、低资源环境
尝试自由
Pocket TTS 自由
由Kyutai(Moshi的孵化器)制作的口袋 TTS(Pocket TTS)是一个100M参数文本到语音的紧凑模型,其重量远远超过其重量。 它在CPU上有效运行,支持单一音频样本的零光语音克隆,并制作自然声音演讲。 小型模型大小使得它适合边缘部署和低资源环境。
最佳用于: 轻量度部署、仅使用CPU的环境、快速语音克隆
尝试自由
Kitten TTS 自由
KittenML的Kitten TTS是建立在ONNX上的一种超轻量量级文本到语音模型。根据15M至80M参数的变体(盘上为25-80MB),它可以在不需要GPU的情况下在CPU上提供高质量的语音合成。特点包括8个内置声音、可调整的语音速度以及数字、货币和单位的内置文本预处理。边端部署和低长应用的理念。
最佳用于: 快速轻型TTTS、边缘部署、低延迟应用
尝试自由
Ming-Omni TTS 自由
包含Ming-omni-tts-0.5BAAI是一种紧凑的全式调音模型,它以保修MM密度的骨干为基础,配上一个接接接接接接接字流匹配音频解码器,输出44.1kHz输出(近CD质量),支持3+2参考的零发语音克隆,并通过JSON指示包括内置情感/方言/BGM控制。极稳定——中国基准为0.83%。
最佳用于: 高忠诚双语解说、情绪控制的声音演唱、中文音频书内容
尝试自由
MOSS-TTS Nano 自由
MOSS-TTS-Nano-100M是OSS-TTS家族最紧凑的100M参数变体,分享延迟转换结构。将8B模型的峰值质量转换为~80x较小的重量和大大降低的每个要求VRAM,使之适合自由水平和高吞吐量部署。相同的20种语言范围。
最佳用于: 自由级TTTS、高容量生产、低长度交互式使用
尝试自由
CosyVoice 2 标准标准标准标准
Alibaba可伸缩的TTS流 与人类的平衡性自然和接近零的悬浮。
开发者 : Alibaba (Tongyi Lab) · 驾照 : Apache 2.0
试试
VieNeu-TTS-v2 标准标准标准标准
越南语+英语代码转换 TTS, 有 7 个预设声音和零发声音克隆。 仅使用CPU, 不需要 GPU 。
开发者 : Phạm Nguyễn Ngọc Bảo · 驾照 : Apache 2.0
试试
Darwin TTS 标准标准标准标准
跨模式的Quen3-TTS变式,加上从Quen3-1.7B语言模型中混合的FFN重量,用于更敏锐的多语种克隆。
开发者 : FINAL-Bench · 驾照 : Apache 2.0
试试
MOSS-TTS Nano
微小100M MOS-TTS变式——相同的结构,80x较小,自由的延缓。
语言: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
克隆声音开发者- 第一 API
OpenAI-兼容的REST API. 一个端点, 22+模型, 流传实时应用支持 。
- OpenAI-兼容格式
- 实时应用程序流流 TTS
- 大型工作的批次处理
- WebHook 通知
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
简单、透明定价
开始自由。 随你成长, 缩放 。
常问问题
我们能改进什么?您的反馈帮助我们解决问题。