API chuyển văn bản sang nói cho các nhà phát triểnName
Tạo ứng dụng có khả năng nói với REST API của chúng tôi. Thêm văn bản tự nhiên thành lời nói, sao chép giọng nói, nói thành văn bản, và xử lý âm thanh cho ứng dụng, chatbots, trợ lý giọng nói, và sản phẩm SaaS của bạn. Định dạng tương thích OpenAI, 20+ mẫu, tích hợp đơn giản.
Thử ngay
Tính năng API cho nhà phát triển
Mọi thứ bạn cần để xây dựng các ứng dụng có thể nói
API REST đơn giảnName
Một yêu cầu POST để tạo ra giọng nói. Yêu cầu JSON, đáp ứng âm thanh. Làm việc với bất kỳ ngôn ngữ lập trình nào hỗ trợ HTTP.
Hợp tác với OpenAI
Thay thế drop-in cho OpenAI TTS API. Thay đổi base_url và khóa API của bạn — mã hiện có sẽ hoạt động ngay lập tức.
Có 24+ mẫu
Truy cập vào mọi mô hình thông qua một API duy nhất. Thay đổi mô hình bằng cách thay đổi một tham số. So sánh chất lượng, tốc độ và chi phí.
Độ trễ dưới giây
Kokoro tạo âm thanh trong chưa đến 1 giây. Hoàn hảo cho chatbots thời gian thực, trợ lý giọng nói, và ứng dụng tương tác.
API sao chép giọng nói
Sao chép bất kỳ giọng nói nào từ một mẫu âm thanh ngắn qua API. Dùng giọng nói sao chép cho tất cả các thế hệ tiếp theo.
Định dạng đa dạng
Xuất dạng WAV, MP3, OGG, hoặc FLAC. Chọn tốc độ lấy mẫu và độ sâu bit. Hỗ trợ âm thanh truyền tải cho các ứng dụng thời gian thực.
Mô hình tốt nhất cho việc tích hợp nhà phát triển
Chọn mẫu phù hợp với tốc độ, chất lượng và yêu cầu chi phí của ứng dụng
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Tốt nhất cho: Mô hình nhanh nhất — độ trễ dưới giây, lý tưởng cho các ứng dụng thời gian thực và chatbots
Thử đi. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Tốt nhất cho: Truyền TTS với kiểu giọng cho ứng dụng trợ lý giọng nói
Thử đi. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Tốt nhất cho: AI nói chuyện với thời gian tự nhiên cho chatbot và giọng trợ lý
Thử đi. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Tốt nhất cho: Mô hình miễn phí, chỉ CPU cho các ứng dụng có khối lượng lớn với chi phí tín dụng bằng 0
Thử đi. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Tốt nhất cho: Tạo âm thanh với hiệu ứng âm thanh cho các ứng dụng sáng tạo và giải trí
Thử đi. BarkCách tích hợp API TTS
Từ khi đăng ký đến cuộc gọi API đầu tiên trong vòng 5 phút
Lấy khóa API của bạn
Đăng ký miễn phí và tạo một chìa khóa API từ bảng điều khiển tài khoản của bạn. 15.000 ký tự bao gồm.
Gọi điện thoại đầu tiên
POST đến /v1/tts với văn bản, mẫu và giọng nói. Lấy lại byte âm thanh. Dưới 5 dòng mã.
Chọn mô hình
Kiểm tra các mô hình khác nhau cho trường hợp sử dụng của bạn. So sánh tốc độ, chất lượng và chi phí mỗi thế hệ.
Gửi đến sản xuất
Mở rộng với các tính năng trả theo sử dụng. Không giới hạn tốc độ trên các kế hoạch trả phí. Kiểm soát sử dụng trong bảng điều khiển.
Ví dụ mã bắt đầu nhanh
Tổng hợp TTS.ai trong bất kỳ ngôn ngữ nào với REST API của chúng tôi
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Những gì các nhà phát triển xây dựng với TTS.ai
Các mẫu và ứng dụng tích hợp phổ biến
Trình trợ lý và trò chuyện AIName
Thêm kết quả giọng nói cho chatbot hoặc trợ lý AI của bạn. Đưa trả lời LLM qua TTS cho giao diện có khả năng nói. Kokoro cung cấp thời gian đợi dưới giây cho các cuộc trò chuyện thời gian thực. Sesame CSM tạo ra giọng nói nói chuyện với thời gian tự nhiên.
- Phản ứng LLM với đường ống nóiName
- Tốc độ chậm dưới giây với Kokoro
- Tiếng nói giao tiếp với Sesame CSM
- Đầu ra âm thanh
Ứng dụng di động và giọng nóiName
Tạo ứng dụng di động có khả năng nghe giọng nói, công cụ hỗ trợ người khuyết tật, ứng dụng đọc sách, và nền tảng học ngôn ngữ. API REST của chúng tôi hoạt động với bất kỳ khung di động nào. Tải về các tập tin âm thanh hoặc truyền trực tiếp đến máy khách.
- React Native, Flutter, Swift, Kotlin
- Ứng dụng hỗ trợ và đọc
- Nền tảng học ngôn ngữ
- Tạo nội dung âm thanh
Sản phẩm SaaS
Các tính năng giọng nói white-label trong sản phẩm SaaS của bạn. Thêm TTS, STT, sao chép giọng nói, và xử lý âm thanh như các tính năng trong nền tảng của bạn. Dùng API của chúng tôi như phần mềm hỗ trợ giọng nói của bạn mà không cần quản lý cơ sở hạ tầng GPU.
- Tính năng giọng nói White- label
- Không cần cơ sở hạ tầng GPU
- Giá tiền theo sử dụng
- 20+ mẫu để cung cấp cho người dùng của bạn
Đường ống tự động
Tạo ra hàng ngàn tập tin âm thanh từ dữ liệu bảng tính, tự động sản xuất podcast, hoặc xây dựng các đường ống nội dung bản địa hóa.
- Xử lý hàng loạt qua API
- Đường ống bản địa hóa nội dung
- Hợp nhất CI/CD
- Tập tin bảng tính để tự động hóa âm thanh
Đặc điểm API
Được xây dựng cho các ứng dụng sản xuất
20+
Mô hình TTS
100+
Giọng nói
30+
Ngôn ngữ
<1s
Để mãi (Kokoro)
Câu hỏi thường gặp
Câu hỏi thường gặp về API phát triển TTS.ai
Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.
Sẵn sàng xây dựng với giọng nói AI?
Tìm khóa API miễn phí và bắt đầu xây dựng. 15.000 ký tự khi đăng ký, mẫu miễn phí, tài liệu đầy đủ.