개발자를 위한 텍스트 음성 API
REST API를 사용하여 음성 기반 애플리케이션을 구축합니다. 앱, 채팅 봇, 음성 지원 및 SaaS 제품에 자연스러운 텍스트-음성, 음성 복제, 음성-텍스트 및 오디오 처리를 추가합니다. OpenAI 호환 형식, 20개 이상의 모델, 간단한 통합.
지금 시도해 보세요
개발자를 위한 API 기능
음성 지원 애플리케이션을 구축하는 데 필요한 모든 것
간단한 REST API
한 번의 POST 요청으로 음성을 생성합니다. JSON 요청, 오디오 응답. HTTP를 지원하는 모든 프로그래밍 언어에서 작동합니다.
OpenAI 호환
기존 코드가 즉시 작동하도록 base_url과 API 키를 전환합니다.
사용 가능한 24+ 모델
단일 API를 통해 모든 모델에 액세스하세요. 하나의 매개변수를 변경하여 모델을 전환하세요. 품질, 속도, 비용을 비교하세요.
서브- 초 지연
Kokoro는 1초 이내에 오디오를 생성하므로 실시간 채팅봇, 음성 지원 및 대화형 애플리케이션에 완벽합니다.
음성 복제 API
API를 통해 짧은 오디오 샘플에서 어떤 목소리든 복제할 수 있습니다. 복제된 목소리를 모든 후속 세대에 사용할 수 있습니다.
여러 형식
WAV, MP3, OGG 또는 FLAC로 출력. 샘플 레이트와 비트 깊이를 선택하세요. 실시간 앱을 위한 스트리밍 오디오 지원.
개발자 통합을 위한 최고의 모델
애플리케이션의 속도, 품질 및 비용 요구 사항에 맞는 모델 선택
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
최적의 용도: 가장 빠른 모델 — 초 이하의 지연 시간, 실시간 앱 및 채팅 봇에 이상적
시도해 보기 Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
최적의 용도: 음성 지원 애플리케이션을 위한 음성 복제 기능이 있는 TTS 스트리밍
시도해 보기 CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
최적의 용도: 채팅봇 및 보조 음성을 위한 자연스러운 타이밍을 갖춘 대화형 AI
시도해 보기 Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
최적의 용도: 비용 없이 대용량 애플리케이션을 위한 무료 CPU 전용 모델
시도해 보기 Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
최적의 용도: 크리에이티브 및 엔터테인먼트 애플리케이션을 위한 사운드 효과가 있는 오디오 생성
시도해 보기 BarkTTS API를 통합하는 방법
가입부터 첫 번째 API 호출까지 5분 이내
API 키 가져오기
무료로 가입하고 계정 대시보드에서 API 키를 생성하세요. 15,000자 포함.
첫번째 전화를 걸기
/v1/tts에 텍스트, 모델, 음성을 POST합니다. 오디오 바이트를 가져옵니다. 5줄의 코드로.
모델을 선택하세요
사용 사례에 맞는 다양한 모델을 테스트합니다. 속도, 품질 및 세대당 비용을 비교합니다.
생산에 배송
사용량 기반 요금제로 확장 가능합니다. 유료 플랜에 속도 제한이 없습니다. 대시보드에서 사용량을 모니터링합니다.
빠른 시작 코드 예제
REST API로 모든 언어로 TTS.ai 통합
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
개발자가 TTS.ai으로 구축하는 것
일반적인 통합 패턴 및 애플리케이션
AI 채팅봇 및 어시스턴트
채팅 봇 또는 AI 어시스턴트에 음성 출력을 추가합니다. 음성 인터페이스를 위한 TTS를 통해 LLM 응답을 파이프로 전송합니다. Kokoro는 실시간 대화를 위해 초 이하의 지연 시간을 제공합니다.
- 음성 파이프라인에 대한 LLM 응답
- Kokoro로 초 이하의 지연 시간
- 참깨 CSM과 대화 연설
- 스트리밍 오디오 출력
모바일 및 음성 앱
음성 지원 모바일 앱, 접근성 도구, 독서 앱, 언어 학습 플랫폼을 구축하세요. REST API는 모든 모바일 프레임워크에서 작동하며 오디오 파일을 다운로드하거나 클라이언트로 직접 스트리밍할 수 있습니다.
- React Native, 플러터, 스위프트, Kotlin
- 손쉬운 사용 및 읽기 앱
- 언어학습 플랫폼
- 오디오 콘텐츠 생성
SaaS 제품 목록
SaaS 제품의 화이트 라벨 음성 기능. 플랫폼에 TTS, STT, 음성 복제, 오디오 처리 기능을 추가하세요. GPU 인프라를 관리하지 않고도 API를 음성 백엔드로 사용할 수 있습니다.
- 화이트 라벨 음성 기능
- GPU 인프라 필요 없음
- 사용당 요금제
- 사용자에게 제공하는 20+ 모델
자동화 파이프라인
음성 생성을 CI/CD 파이프라인, 콘텐츠 자동화 및 일괄 처리 워크플로우에 통합합니다. 스프레드시트 데이터에서 수천 개의 오디오 파일을 생성하고, 팟캐스트 제작을 자동화하거나, 콘텐츠 현지화 파이프라인을 구축합니다.
- API를 통한 일괄 처리
- 콘텐츠 현지화 파이프라인
- CI/CD 통합
- 스프레드시트에서 오디오 자동화로
자주 묻는 질문
TTS.ai 개발자 API에 대한 일반적인 질문
개선할 수 있는 점은 무엇입니까? 고객님의 피드백이 문제를 해결하는 데 도움이 됩니다.