为开发者编写的语音 API 文本
与 REST API 建立语音应用程序。 在您的应用程序、聊天器、语音助理和SaaS 产品中添加自然文字到语音、语音克隆、语音到文字、语音处理和音频处理。 与 OpenAI 兼容的格式、 20+ 模型、 简单集成。
用于开发者的 APP 特征
建立语音应用程序所需的一切
简单 REST API
一个POST 请求生成演讲。 JSON 请求, 音频响应。 使用任何支持 HTTP 的编程语言 。
OpenAI-兼容性
OpenAI TTS API 的空置替换。 切换您的基础 url 键和 API 键—— 现有的代码立即有效 。
24+ 可用模型
通过单一的 API 访问每个模型。 通过改变一个参数来切换模型。 比较质量、 速度和成本 。
第二二级延迟期
Kokoro在1秒内生成音频。 适合实时聊天机、 语音助理和互动应用程序 。
语音克隆API
通过 API 从短音频样本中打开任何声音。 为后代使用克隆声音 。
多重格式
输出为 WAV、 MP3、 OGG 或 FLAC 。 选择样本率和位深。 流传实时应用程序的音频支持 。
开发者融合最佳模式
选择适合您应用程序速度、质量和成本要求的正确模式
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
最佳用于: 最快速的模型——次秒延缓期,实时应用程序和聊天器的理想
尝试 Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
最佳用于: 为语音助理应用程序提供语音克隆的流流 TTS
尝试 CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
最佳用于: 具有聊天机和助理声音自然时间的交流性AI
尝试 Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
最佳用于: 免费、仅使用CPU的免费高容量应用模式,零费用
尝试 Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
最佳用于: 具有创作和娱乐应用程序声音效果的音频生成
尝试 Bark如何整合 TTS API
从注册到第一次API呼叫 不到5分钟
获得您的 API 密钥
免费签名并从您的账户仪表板上生成 API 密钥。 包括 15,000 个字符 。
第一次拨打
POST 到 / v1/ tts, 带有文本、 模型和声音。 获取音频字节。 低于 5 条代码 。
选择您的模型
为您测试不同的使用模式。 比较速度、 质量和每代成本 。
船舶生产至船舶生产
以现收现付字符缩放。 付款计划没有利率限制。 监视仪表板的使用 。
快速启动代码示例
以任何语言将TTS.ai语融入我们的REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
开发者用 TTS.ai 构建什么
共同一体化模式和应用
AI 聊天和助理
添加语音输出到您的聊天室或 AI 助手 。 Pipe LLM 响应通过 TTS 进行语音连接。 Kokoro 为实时对话提供第二秒的中继时间 。 Sesame CSM 生成有自然时间的谈话演讲 。
- LLM对语音管道的反应
- 与Kokoro的二次延时
- 与Sesame CSM的谈话演讲
- 流动音频输出
移动语音应用程序
建立语音驱动的移动应用程序、无障碍工具、阅读应用程序和语言学习平台。 我们的REST API与任何移动框架一起工作。 下载音频文件或直接流到客户手中 。
- 原生、小蝶、斯威夫特、科特林
- 无障碍和阅读应用程序
- 语言学习平台
- 音频内容制作
SaaS 产品
在您的 SaaS 产品中添加白标签语音能力。 在您的平台中添加 TTS、STT、语音克隆和音频处理功能。 使用我们的 API 作为您的语音后端, 而不管理 GPU 基础设施 。
- 白标签语音功能
- 不需要 GPU 基础设施
- 付费-每用使用定价
- 向用户提供20+模型
自动化管道
将语音生成纳入 CI/CD 管道、内容自动化和批量处理工作流程。 从电子表格数据生成数千个音频文件,自动制作播客,或建立内容本地化管道。
- 通过 API 批量处理
- 内容本地化管道
- CI/CD一体化
- 音频自动化电子表格
常问问题
关于TTS.ai开发者API的共同问题
我们能改进什么?您的反馈帮助我们解决问题。