អត្ថបទទៅការនិយាយ API សម្រាប់អ្នកអភិវឌ្ឍន៍
បង្កើតកម្មវិធីដែលអនុញ្ញាតឱ្យមានសំឡេងជាមួយ REST API របស់យើង។ បន្ថែមអត្ថបទទៅជាសំឡេងធម្មជាតិ, ការចម្លងសំឡេង, ការនិយាយទៅជាអត្ថបទនិងដំណើរការអូឌីយ៉ូទៅកម្មវិធីរបស់អ្នក, chatbots, អ្នកជំនួយការសំឡេងនិងផលិតផល SaaS ។ ទ្រង់ទ្រាយ OpenAI ឆបគ្នា, ម៉ូដែល 20 +, ការរួមបញ្ចូលសាមញ្ញ។
សាកល្បងវាឥឡូវ
លក្ខណៈពិសេស API សម្រាប់អ្នកអភិវឌ្ឍន៍
អ្វីដែលអ្នកត្រូវការដើម្បីស្ថាបនាកម្មវិធីដែលអាចនិយាយបាន
REST API ធម្មតា
សំណើ POST មួយដើម្បីបង្កើតការនិយាយ & # 160; ។ សំណើ JSON ការឆ្លើយតបអូឌីយ៉ូ & # 160; ។ ធ្វើការជាមួយភាសាកម្មវិធីណាមួយដែលគាំទ្រ HTTP & # 160; ។
ឆបគ្នាជាមួយ OpenAI
Drop- ក្នុង ការ ជំនួស សម្រាប់ OpenAI TTS API. ប្តូរ base_url និង កូនសោ API របស់ អ្នក - កូដ បច្ចុប្បន្ន ធ្វើការ ភ្លាមៗ.
24+ ម៉ូដែលដែលអាចរកបាន
ចូលដំណើរការម៉ូដែលនីមួយៗតាមរយៈ API មួយ ។ ប្ដូរម៉ូដែលដោយផ្លាស់ប្ដូរប៉ារ៉ាម៉ែត្រមួយ ។ ប្រៀបធៀបគុណភាព ល្បឿន និងតម្លៃ ។
ការពន្យាររងវិនាទី
Kokoro បង្កើតអូឌីយ៉ូក្នុងរយៈពេលក្រោម ១ វិនាទី ។ ល្អឥតខ្ចោះសម្រាប់កម្មវិធីជជែកកំសាន្តពេលវេលាពិត កម្មវិធីជំនួយសំឡេង និងកម្មវិធីអន្តរកម្ម ។
API ក្លូនសំឡេង
ក្លូនសំឡេងណាមួយពីគំរូអូឌីយ៉ូខ្លីតាមរយៈ API & # 160; ។ ប្រើសំឡេងក្លូនសម្រាប់ជំនាន់បន្ទាប់ទាំងអស់ & # 160; ។
ទ្រង់ទ្រាយច្រើន
លទ្ធផលជា WAV, MP3, OGG ឬ FLAC & # 160; ។ ជ្រើសអត្រាគំរូ និងជម្រៅប៊ីត & # 160; ។ គាំទ្រអូឌីយ៉ូស្ទ្រីមសម្រាប់កម្មវិធីពេលវេលាពិត & # 160; ។
ម៉ូដែលល្អបំផុតសម្រាប់ការរួមបញ្ចូលអ្នកអភិវឌ្ឍន៍
ជ្រើសម៉ូដែលត្រឹមត្រូវសម្រាប់ល្បឿនកម្មវិធីរបស់អ្នក គុណភាព និងតម្រូវការតម្លៃ
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
ល្អបំផុតសម្រាប់ & # 160; ៖ ម៉ូដែលលឿនបំផុត - sub-second latency, ល្អឥតខ្ចោះសម្រាប់កម្មវិធីពេលវេលាពិតនិង chatbots
ព្យាយាម Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ល្អបំផុតសម្រាប់ & # 160; ៖ ស្ទ្រីម TTS ជាមួយការក្លូនសំឡេងសម្រាប់កម្មវិធីជំនួយការសំឡេង
ព្យាយាម CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
ល្អបំផុតសម្រាប់ & # 160; ៖ AI ការសន្ទនាជាមួយការកំណត់ពេលវេលាធម្មជាតិសម្រាប់ chatbot និងសំឡេងជំនួយការ
ព្យាយាម Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
ល្អបំផុតសម្រាប់ & # 160; ៖ ម៉ូដែលតែស៊ីភីយូដោយឥតគិតថ្លៃសម្រាប់កម្មវិធីកម្រិតខ្ពស់ដែលមានតម្លៃឥណទានសូន្យ
ព្យាយាម Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
ល្អបំផុតសម្រាប់ & # 160; ៖ ការបង្កើតអូឌីយ៉ូជាមួយបែបផែនសំឡេងសម្រាប់កម្មវិធីច្នៃប្រឌិត និងកំសាន្ត
ព្យាយាម Barkតើធ្វើដូចម្តេចដើម្បីបញ្ចូល TTS API
ចាប់ពីចុះឈ្មោះរហូតដល់ការហៅ API ដំបូងក្នុងរយៈពេល5នាទី
យកសោ API របស់អ្នក
ចុះឈ្មោះដោយឥតគិតថ្លៃនិងបង្កើតកូនសោ API ពី dashboard គណនីរបស់អ្នក. 15,000 តួអក្សររួមបញ្ចូល។
ធ្វើការហៅដំបូងរបស់អ្នក
POST ទៅ / v1 / tts ជាមួយអត្ថបទ, ម៉ូដែល, និងសំឡេង. ទទួលបានបៃអូឌីយ៉ូត្រឡប់មកវិញ. ក្រោម5បន្ទាត់នៃកូដ.
ជ្រើសម៉ូដែលរបស់អ្នក
សាកល្បងម៉ូដែលផ្សេងគ្នាសម្រាប់ករណីប្រើរបស់អ្នក ។ ប្រៀបធៀបល្បឿន គុណភាព និងតម្លៃក្នុងមួយជំនាន់ ។
ផ្ញើទៅផលិតកម្ម
មាត្រដ្ឋានជាមួយតួអក្សរបង់ប្រាក់តាមដែលអ្នកទៅ។ គ្មានដែនកំណត់អត្រាលើផែនការដែលបានបង់។ ត្រួតពិនិត្យការប្រើប្រាស់នៅក្នុង dashboard របស់អ្នក។
ឧទាហរណ៍កូដចាប់ផ្ដើមរហ័ស
បញ្ចូល TTS.ai ក្នុងភាសាណាមួយជាមួយ REST API របស់យើង
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
តើអ្នកអភិវឌ្ឍន៍បង្កើតជាមួយ TTS.ai
លំនាំការបញ្ចូលគ្នាទូទៅ និងកម្មវិធី
AI Chatbots និងអ្នកជំនួយការ
បន្ថែមលទ្ធផលសំឡេងទៅ chatbot ឬអ្នកជំនួយការ AI របស់អ្នក។ ចម្លើយ LLM បំពង់តាមរយៈ TTS សម្រាប់ចំណុចប្រទាក់ដែលអនុញ្ញាតឱ្យមានសំឡេង។ Kokoro ផ្គត់ផ្គង់ការពន្យារពេលក្រោមវិនាទីសម្រាប់ការសន្ទនាពេលវេលាពិត។ Sesame CSM បង្កើតការនិយាយការសន្ទនាជាមួយនឹងការកំណត់ពេលវេលាធម្មជាតិ។
- ការឆ្លើយតប LLM ទៅបំពង់និយាយ
- ភាពយឺតពេលរងវិនាទីជាមួយ Kokoro
- ការនិយាយជាមួយ Sesame CSM
- លទ្ធផលអូឌីយ៉ូស្ទ្រីម
កម្មវិធីសំឡេង និងចល័តName
បង្កើតកម្មវិធីចល័តដែលអនុញ្ញាតឱ្យមានសំឡេង, ឧបករណ៍ងាយស្រួលប្រើ, កម្មវិធីអាននិងវេទិការៀនភាសា. REST API របស់យើងធ្វើការជាមួយគ្រោងការណ៍ចល័តណាមួយ. ទាញយកឯកសារអូឌីយ៉ូឬស្ទ្រីមដោយផ្ទាល់ទៅម៉ាស៊ីនភ្ញៀវ.
- React ដើម Flutter Swift Kotlin
- កម្មវិធីមធ្យោបាយងាយស្រួល និងអាន
- វេទិការៀនភាសា
- ការបង្កើតមាតិកាអូឌីយ៉ូ
ផលិតផល SaaS
បន្ថែម TTS, STT, ក្លូនសំឡេងនិងដំណើរការអូឌីយ៉ូជាលក្ខណៈពិសេសនៅក្នុងវេទិការបស់អ្នក។ ប្រើ API របស់យើងជា backend សំឡេងរបស់អ្នកដោយមិនចាំបាច់គ្រប់គ្រងហេដ្ឋារចនាសម្ព័ន្ធ GPU ។
- លក្ខណៈពិសេសសំឡេងស្លាកស
- គ្មានមូលដ្ឋានគ្រឹះ GPU ដែលត្រូវការ
- តម្លៃបង់តាមការប្រើ
- 20+ ម៉ូដែលដើម្បីផ្តល់ជូនអ្នកប្រើរបស់អ្នក
បំពង់ស្វ័យប្រវត្តិ
បញ្ចូលការបង្កើតសំឡេងទៅក្នុងបំពង់ CI / CD ស្វ័យប្រវត្តិកម្មមាតិកានិងលំហូរការងារដំណើរការ batch ។ បង្កើតឯកសារអូឌីយ៉ូរាប់ពាន់ពីទិន្នន័យសន្លឹកបៀស្វ័យប្រវត្តិកម្មផលិតកម្មផតខាស់ឬស្ថាបនាបំពង់ការបកប្រែមាតិកា ។
- ដំណើរការបាច់តាមរយៈ API
- បំពង់ការកំណត់ទីតាំងមាតិកា
- ការបញ្ចូលគ្នា CI/CD
- សន្លឹកបញ្ជីទៅស្វ័យប្រវត្តិអូឌីយ៉ូ
ការបញ្ជាក់ API
ស្ថាបនាសម្រាប់កម្មវិធីផលិតកម្ម
20+
ម៉ូដែល TTS
100+
សំឡេង
30+
ភាសា
<1s
ការពន្យារ (Kokoro)
សំណួរដែលសួរញឹកញាប់
សំណួរទូទៅអំពីកម្មវិធីអភិវឌ្ឍន៍ TTS.ai API
តើយើងអាចធ្វើអ្វីបានប្រសើរឡើង & # 160;? មតិយោបល់របស់អ្នកជួយយើងជួសជុលបញ្ហា & # 160; ។
ត្រៀមខ្លួនរួចរាល់ហើយដើម្បីសាងសង់ជាមួយ AI សំឡេង?
ទទួលបានកូនសោ API ឥតគិតថ្លៃរបស់អ្នកនិងចាប់ផ្តើមសាងសង់. 50 ពិន្ទុលើការចុះឈ្មោះ, ម៉ូដែលឥតគិតថ្លៃដែលអាចប្រើបាន, ឯកសារទូលំទូលាយ.