ข้อความเป็นเสียง API สำหรับผู้พัฒนา
สร้างแอพพลิเคชันที่รองรับการพูดด้วย REST API ของเรา เพิ่มการแปลงข้อความเป็นเสียงตามธรรมชาติ, การคอลลินเสียง, การแปลงเสียงเป็นข้อความ, และการประมวลผลเสียงไปยังแอพพลิเคชันของคุณ, เครื่องสนทนา, ผู้ช่วยเสียง, และผลิตภัณฑ์ SaaS รูปแบบที่เข้ากันได้กับ OpenAI, โมเดล 20+ และการรวมเข้าด้วยกันที่ง่าย
ลองดูสิ
ตัวช่วย API สำหรับผู้พัฒนา
ทุกอย่างที่คุณต้องการเพื่อสร้างแอพพลิเคชันที่รองรับการสื่อสารด้วยเสียง
REST API ง่ายๆName
การร้องขอ POST ครั้งเดียวเพื่อสร้างการพูด การร้องขอ JSON การตอบสนองเสียง ทำงานกับภาษาโปรแกรมใด ๆ ที่รองรับ HTTP
เข้ากันได้กับ OpenAI
ตัวแทนสำหรับ OpenAI TTS API เปลี่ยน base_ url และกุญแจ API ของคุณ - โค้ดที่มีอยู่จะทำงานทันที
มีตัวอย่างมากกว่า 24 ตัว
เข้าถึงทุกโมเดลผ่าน API เดียว สลับโมเดลโดยการเปลี่ยนพารามิเตอร์ 1 ตัว เปรียบเทียบคุณภาพ ความเร็ว และราคา
ความล่าช้าของตัวเลขสองตัว
Kokoro สร้างเสียงในเวลาไม่ถึง 1 วินาที เหมาะสำหรับช็อตบ็อทแบบเรียลไทม์ ช่วยเหลือเสียง และแอพพลิเคชั่นแบบโต้ตอบ
ตัวกรองเสียง
สร้างเสียงใดๆ จากตัวอย่างเสียงสั้นๆ ผ่าน API ใช้เสียงที่สร้างมาแล้วสำหรับรุ่นต่อไป
รูปแบบหลายรูปแบบ
ออกแบบเป็น WAV, MP3, OGG หรือ FLAC เลือกอัตราตัวอย่างและความลึกของบิต รองรับการสตรีมเสียงสำหรับแอพพลิเคชันแบบ real- time
โมเดลที่ดีที่สุดสำหรับผู้พัฒนาที่รวมเข้าด้วยกัน
เลือกโมเดลที่เหมาะสมกับความเร็ว คุณภาพ และค่าใช้จ่ายของโปรแกรมของคุณ
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
เหมาะสำหรับ: โมเดลที่เร็วที่สุด - ความล่าช้าในระดับเซลล์วินาที เหมาะสำหรับแอพพลิเคชันและชัตเตอร์บ็อตที่ใช้เวลาจริง
ลองดูสิ Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
เหมาะสำหรับ: กระจายเสียง TTS ด้วยการคอลลินเสียงสำหรับแอพพลิเคชันผู้ช่วยเสียง
ลองดูสิ CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
เหมาะสำหรับ: เอไอในการสนทนาด้วยการกำหนดเวลาตามธรรมชาติสำหรับช็อตบ็อทและเสียงผู้ช่วย
ลองดูสิ Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
เหมาะสำหรับ: โมเดล CPU-only ฟรีสำหรับแอพพลิเคชันที่มีปริมาณสูง โดยไม่มีค่าใช้จ่ายในการจัดเก็บข้อมูล
ลองดูสิ Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
เหมาะสำหรับ: สร้างเสียงด้วยเอฟเฟกต์เสียงสำหรับแอพพลิเคชันสร้างสรรค์และบันเทิง
ลองดูสิ Barkวิธีการรวม API ของ TTS
ตั้งแต่ลงทะเบียนจนถึงการเรียก API ครั้งแรกในเวลาไม่ถึง5นาที
ดาวน์โหลดกุญแจ API ของคุณ
ลงทะเบียนฟรี และสร้างกุญแจ API จากแดชบอร์ดบัญชีของคุณ 15,000 ตัวอักษรรวมอยู่ใน
โทรครั้งแรกของคุณ
เขียนไปที่ /v1/tts ด้วยข้อความ โมเดล และเสียง เอาไบต์เสียงกลับมา ด้วยโค้ด5บรรทัด
เลือกรุ่นของคุณ
ทดสอบโมเดลต่างๆ สำหรับกรณีการใช้ของคุณ เปรียบเทียบความเร็ว คุณภาพ และราคาต่อรุ่น
ส่งไปยังการผลิต
ปรับขนาดด้วยตัวอักษรจ่ายตามที่คุณใช้ ไม่มีค่าจำกัดอัตราต่อแพ็คเกจที่จ่าย ติดตามการใช้ในแดชบอร์ดของคุณ
ตัวอย่างโค้ดเริ่มต้นเร็ว
เชื่อมต่อ TTS.ai ในภาษาใด ๆ ด้วย REST API ของเรา
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
สิ่งที่ผู้พัฒนาสร้างด้วย TTS.ai
รูปแบบการรวมตัวและโปรแกรมที่ใช้กันทั่วไป
เครื่องมือและผู้ช่วย AI Chatbots
เพิ่มการออกเสียงไปยังหุ่นคุยหรือผู้ช่วย AI ของคุณ นำการตอบสนอง LLM ผ่าน TTS สำหรับอินเทอร์เฟซที่รองรับเสียง Kokoro จัดส่งการช้าลงในระดับหนึ่งวินาทีสำหรับการสนทนาในเวลาจริง Sesame CSM สร้างการพูดคุยด้วยการจับเวลาตามธรรมชาติ
- การตอบสนอง LLM ต่อท่อเสียง
- ความล่าช้าของโคโคโร
- พูดคุยกับ Sesame CSM
- ข้อมูลออกมาเป็นสัญญาณเสียง
โปรแกรมโทรศัพท์มือถือและเสียงName
สร้างแอพพลิเคชันมือถือที่รองรับเสียง เครื่องมือช่วยเหลือผู้พิการ แอพพลิเคชันอ่านหนังสือ และแพลตฟอร์มการเรียนรู้ภาษา REST API ของเราทำงานกับเฟรมเวิร์กมือถือใดๆ ดาวน์โหลดแฟ้มเสียง หรือสตรีมโดยตรงไปยังคลาวด์
- รีแอคท เนทีฟ, ฟลูเตอร์, สวิฟท์, โคทลิน
- โปรแกรมอ้างอิงและอ่าน
- ระบบการเรียนรู้ภาษา
- สร้างเนื้อหาเสียง
ผลิตภัณฑ์ SaaS
เพิ่ม TTS, STT, การคลอนเสียง, และการประมวลผลเสียงเป็นฟังก์ชันในแพลตฟอร์มของคุณ ใช้ API ของเราเป็นแบ็คเอนด์เสียงของคุณโดยไม่ต้องจัดการโครงสร้างพื้นฐานของ GPU
- ตัวเลือกเสียงแบบ White- label
- ไม่ต้องใช้โครงสร้างพื้นฐานของ GPU
- ค่าใช้จ่ายต่อการใช้งาน
- 20+ แบบจำลองที่จะเสนอผู้ใช้ของคุณ
เส้นทางอัตโนมัติ
เชื่อมต่อการสร้างเสียงเข้ากับระบบท่อ CI/CD, การอัตโนมัติเนื้อหา, และกระบวนการประมวลผลแบตต์ สร้างแฟ้มเสียงเป็นพัน ๆ จากข้อมูลในสแปม, การผลิตพอดคาสต์อัตโนมัติ, หรือสร้างท่อการแปลเนื้อหาเป็นภาษาท้องถิ่น
- ประมวลผลเป็นกลุ่มผ่าน API
- เส้นทางสื่อการสื่อสารภายในประเทศ
- การรวม CI/CD
- ทำสแปมให้เป็นออโต้
ข้อมูลเฉพาะของ API
สร้างขึ้นเพื่อการผลิต
20+
โมเดล TTS
100+
เสียง
30+
ภาษา
<1s
ความล่าช้า (Kokoro)
คำถามที่ถามบ่อย
คำถามที่พบบ่อยเกี่ยวกับ API ของผู้พัฒนา TTS.ai
เราจะปรับปรุงอะไรได้บ้าง ความคิดเห็นของคุณช่วยเราแก้ไขปัญหา