免费AI 免费AI 文本到语音
20+ 开放源模式, 107+ 声音, 32+ 不需要账户。
呼声AI需要的一切
30+ 由开放源码AI 模型驱动的工具
20+ AI 声音模型
在一个平台最全面地收集开放源代码 TTS 模型
Kokoro Free
Kokoro是一个8200万个参数文本到语音模型,大大高于其重量级。 尽管其体积小,但它能产生非常自然和直言不讳的演讲。 Kokoro支持多种语言,包括英语、日语、中文和韩语,并有各种表达声音。 它的运行速度非常快 — — 在GPU上生成的音频速度比实时速度快近100倍。
最佳用于: 高质量的TTTS,最短的延迟、流流应用
尝试自由
Piper Free
Piper是由Rhasspy开发的轻量级文本到语音引擎,它使用VITS和Lalynx结构。它完全在CPU上运行,对边缘设备、家庭自动化和需要离线 TTS 的应用程序来说是理想的。 Piper有超过100个超过30种语言的语音,即使以Raspberry Pi 4 的实时速度,它也以实时速度提供自然声音。
最佳用于: 快速预览、可访问性和嵌入应用程序
尝试自由
VITS Free
VITS(对终端至终端文字到语音的对抗性学习的变化性推断)是一种平行的终端至终端TTS方法,比目前的两阶段模型产生更自然的音频,采用变式推论,辅之以正常流动和对抗性培训过程,使自然性得到显著改善。
最佳用于: 具有自然流动作用的普通用途文字对文字的语音
尝试自由
MeloTTS Free
MyShell.ai的MelotTS是一个多语言的TTS图书馆,支持英语(美国、英国、印度、澳大利亚)、西班牙语、法语、中文、日语和韩语。它非常快,仅以近实时速度处理CPU的文本。MelotTS是为生产用途设计的,支持CPU和GPU的推理。
最佳用于: 需要快速、多语言TTS的生产应用
尝试自由
CosyVoice 2 Standard
Alibaba可伸缩的TTS流 与人类的平衡性自然和接近零的悬浮。
开发者 : Alibaba (Tongyi Lab) · 驾照 : Apache 2.0
试试开发者- 第一 API
OpenAI-兼容的REST API. 一个端点, 22+模型, 流传实时应用支持 。
- OpenAI-兼容格式
- 实时应用程序流流 TTS
- 大型工作的批次处理
- WebHook 通知
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
简单、透明定价
开始自由。 随你成长, 缩放 。