免费AI 免费AI 文本到语音
31+ 开放源模式, 231+ 声音, 34+ 不需要账户。
呼声AI需要的一切
30+ 由开放源码AI 模型驱动的工具
31+ AI 声音模型
在一个平台最全面地收集开放源代码 TTS 模型
Kokoro Free
Kokoro是一个8200万个参数文本到语音模型,大大高于其重量级。 尽管其体积小,但它能产生非常自然和直言不讳的演讲。 Kokoro支持多种语言,包括英语、日语、中文和韩语,并有各种表达声音。 它的运行速度非常快 — — 在GPU上生成的音频速度比实时速度快近100倍。
最佳用于: 高质量的TTTS,最短的延迟、流流应用
尝试自由
Piper Free
Piper是由Rhasspy开发的轻量级文本到语音引擎,它使用VITS和Lalynx结构。它完全在CPU上运行,对边缘设备、家庭自动化和需要离线 TTS 的应用程序来说是理想的。 Piper有超过100个超过30种语言的语音,即使以Raspberry Pi 4 的实时速度,它也以实时速度提供自然声音。
最佳用于: 快速预览、可访问性和嵌入应用程序
尝试自由
VITS Free
VITS(对终端至终端文字到语音的对抗性学习的变化性推断)是一种平行的终端至终端TTS方法,比目前的两阶段模型产生更自然的音频,采用变式推论,辅之以正常流动和对抗性培训过程,使自然性得到显著改善。
最佳用于: 具有自然流动作用的普通用途文字对文字的语音
尝试自由
MeloTTS Free
MyShell.ai的MelotTS是一个多语言的TTS图书馆,支持英语(美国、英国、印度、澳大利亚)、西班牙语、法语、中文、日语和韩语。它非常快,仅以近实时速度处理CPU的文本。MelotTS是为生产用途设计的,支持CPU和GPU的推理。
最佳用于: 需要快速、多语言TTS的生产应用
尝试自由
OuteTTS Free
外部TTS 扩展了具有文本到语音能力的大型语言模型, 同时保存原始结构 。 它支持多个后端, 包括 lama. cpp (CPU/GPU) 、 Huggging Face 变换器、 ExLlamaV2、 VLLM, 甚至浏览器通过变换器推导。 js. 通过以 JSON 保存的语句描述, 功能为零光语音克隆 。
最佳用于: 边缘部署、基于浏览器的TTTS、低资源环境
尝试自由
Pocket TTS Free
由Kyutai(Moshi的孵化器)制作的口袋 TTS(Pocket TTS)是一个100M参数文本到语音的紧凑模型,其重量远远超过其重量。 它在CPU上有效运行,支持单一音频样本的零光语音克隆,并制作自然声音演讲。 小型模型大小使得它适合边缘部署和低资源环境。
最佳用于: 轻量度部署、仅使用CPU的环境、快速语音克隆
尝试自由
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
最佳用于: Fast lightweight TTS, edge deployment, low-latency applications
尝试自由
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
语言: en, zh, ja, ko, de, es, fr, it, ru
克隆声音
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
语言: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
克隆声音
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
语言: en, zh
克隆声音开发者- 第一 API
OpenAI-兼容的REST API. 一个端点, 22+模型, 流传实时应用支持 。
- OpenAI-兼容格式
- 实时应用程序流流 TTS
- 大型工作的批次处理
- WebHook 通知
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
简单、透明定价
开始自由。 随你成长, 缩放 。
常问问题
我们能改进什么?您的反馈帮助我们解决问题。