关于
最全面的开放源码语音AI平台。 20+模型,100+声音, 全部在一个地方。
创建由
TTS.ai 由 John Nader (nadermx), TTS.ai是使人人都能利用最佳的AI语音技术的任务的一部分,没有供应商锁定,没有数据收集,只是以公平价格提供强大的语音技术。
我们特派团
TTS.ai基于一个简单的信念: 最佳的AI 语音技术应该向所有人开放。. 虽然专利服务对基本文字对语音收取溢价,但开放源码社区创造了符合或超过商业质量的模式。
我们把最佳的开放源码语音AI模型 整合成一个单一的、易于使用的平台, 没有供应商锁定, 没有数据采集, 只是价格合理的强大的语音技术。
我们提供什么
文本到语音
20+ 模型包括 Kokoro, Chatterbox, Bark 等。 从快速轻量级合成到工作室质量输出 。
对文本的语音
由耳语、 更快的耳语、 和 senseVoice 提供动力。 以100+ 语言翻译音频, 配有时间戳和语音探测 。
语音克隆
复制来自5秒样本的任何声音。 聊天盒、 GPT- SoVITS、 CosyVoice 2 等。 为您的项目创建自定义声音 。
音频处理
加强音频、删除声频、分裂根、删除回声/反响、检测密钥/BPM和转换格式。 全部由 AI 驱动 。
语音聊天
与 AI 的实时语音对话。 选择您的模式和声音来进行交互式聊天体验 。
开发者 API 开发者 API
OpenAI 兼容的 REST API. Python SDK, 代码示例和综合文档。 在您的应用程序中创建语音功能 。
开源源第一
TTS.ai的每一个模型都是开放源码,根据麻省理工学院或Apache 2.0.。 我们相信透明度和社区驱动的创新。
我们共道
所有模型重量都从其官方储存库下载,我们不增加专利修改。
基础设施基础设施
TTS.ai通过NVIDIA Tesla P40 GPUs(共计96GB VRAM)运行专用的GPU服务器。
- 用于推断的专门的GPU组群 -- -- 没有共享资源
- 基于模式VRAR要求的动态GPU分配
- 优化输送量的5-克优先优先系统
- 为即时推断而预先装入 VRAM 模型
- CDN 支持的用于快速下载的音频传送
隐私和安全
- 无数据培训: 我们从来不用你的音频或文字来训练模型
- 自动删除 : 24小时后自动删除生成的音频
- 加密 : 所有数据均在过境(TLS 1.2+)和休息时加密
- 无跟踪 : 我们共道
- 符合GDPR要求: 在任何时候要求或删除您的数据